دانلود پروژه خوشه بندی بر روی داده های محلی
گروه متلب پروژه پروژه خوشه بندی بر روی داده های محلی را که توسط اساتید این مجموعه تهیه شده است با قیمتی بسیار مناسب برای فروش قرار داده است که همراه با محتوای آموزشی در فایل ورد می باشد.
توضیحات پروژه :
با استفاده از نرمافزار متلب و از دادههای استاندارد سایت Foursquare استفاده میشود. که این دادهها شامل 2153471 کاربر، 1143092 مکان، 1021970 چک، 27098490 اتصالات اجتماعی و 2809581 رتبهبندی که توسط کاربران به مکانهای تعیین شده دادهاند.
محتوای دیتاست:
users.dat: شامل مجموعه ای از کاربران است به طوری که هر کاربر دارای یک شناسه منحصر به فرد و یک مکان جغرافیایی (عرض جغرافیایی و طول جغرافیایی) است که نشان دهنده محل سکونت کاربر شهر خانه.
venues.dat: شامل مجموعه ای از مکان های (مانند رستوران ها) است، به طوری که هر محل دارای شناسه منحصر به فرد و یک مکان جغرافیایی (طول و عرض جغرافیایی) است.
checkins.dat: علامت چک (بازدید کنندگان) از کاربران در محل های. هر چک در یک شناسه منحصر به فرد و همچنین شناسه کاربر و شناسه محل است.
socialgraph.dat: شامل حاشیه های گرافیکی اجتماعی (ارتباطات) که بین کاربران وجود دارد. هر ارتباط اجتماعی شامل دو کاربر (دوستان) است که توسط دو شناسه های منحصر به فرد (first_user_id و second_user_id) نشان داده شده است.
ratings.dat: شامل رتبه بندی های ضمنی است که quantifies چقدر کاربر یک مکان خاص را دوست دارد.
برای 10هزارتا کاربر و مکان تست و پیاده سازی شود.
روش کار: (طبق روش فیلترینگ مشترک)
- ابتدا کاربران با توجه به ارتباط بین آنها خوشه بندی می شوند.(ارتباط دوستی بین کاربران موجود است در دیتاست)
- سپس به کاربرانی که در یک خوشه هستن با توجه به امتیازاتی که دوستان آن در همان خوشه به مکانهای دیگر داده اند پیشنهاد میدهد. (می توان مکان ها رو خوشه بندی کرد با الگوریتم k-means) “کد الگوریتم K-means در فایل کمکی موجود است”
- مسیر بعدی که کاربر می رود بررسی شود که آیا طبق پیشنهاد پیش رفته است یا خیر. (اطلاعات مربوط به چک کاربر از مکانها در دیتاست موجود است و کد آن در فایل کمکی وجود دارد”نیازی به کد نویسی مجدد ندارد”)
- ارزیابی طبق معیارهای دقت ()و فراخوانی (Recall)و F-measure و همچنین معیار خطای توازن (که همگی کدشان موجود است) بررسی شود.(کدهای مربوط به این ارزیابی ها در فایل کمکی موجود است”نیازی به کد نویسی مجدد ندارد” )
اضافه کردن دیتای اضافی:
فقط باید اطلاعات مربوط به ارتباط بین کاربران و همچنین امتیازات به مکانها در متلب وارد شود برای کار جدید به تعداد 10هزار تا از داده ها.
- دیتاهایی که در فایل کمکی استفاده شده در پوشه مربوط قرار داده شده است. به اسم matlab1 می توانید از آنها استفاده کنید همچنین از کدهای برنامه که بیشتر خواسته این ارزیابی رو براورده می کند.(اطلاعاتی مانند یوزرها، چک ها، مکان ها در این فایل اورده شده)
- لطفا اگر ممکن است مکانها خوشه بندی شود و بتوان خوشه ها را کم یا زیاد کرد که در ارزیابی بتوان استفاده کرد. یعنی تعداد خوشه ها را خودم بتونم تغییر بدم مانند فایل کمکی.
- اگر جایی به مشکل خوردید حتما هماهنگ شود بعد انجام شود که به مشکل برخورد نشه.
لینک دیتاست که باید دانلود شود و فایلهای مربوطه اضافه شود.(فایل matlab1 هم از این دیتاست تهیه شده)
- اگر لازم است که یک دیتا جدید خودتون ایجاد کنید موردی ندارد فقط تعدادشان همان 10هزارتا باشد.
توضیحات مجری انجام کار :
فایل اصلی برای اجرا Main_code.m هست.
کد بر روی متلب ورژن R2017a نوشته شده و روی ورژن های 2013 به بالا کار خواهد کرد.
همه داده هایی که برای اجرا نیاز هست به صورت پیش پردازش شده در کنار کد بصورت .mat فایل قرار گرفته که در هربار اجرا بصورت همزمان بارگذاری میشه- داده هایی که استفاده شده شامل 121860 هست که همه اطلاعات مربوط روابط اجتماعی آنها شامل دوستان / محل ها/ …/ استخراج شده/ به عبارت ساده تر شما می توانید تا 121860 تا کاربر رو انتخاب کنید که من صورت پیش فرض مقدار user_number=10000; قرار دادم. می تونید ویرایش کنید
تعداد خوشه بندی های مکان ها هم قابل تنظیم هست و به عنوان پارامتر در برنامه قرار داده شده فعلا توی کد برابر cluster_number=7 تعریف شده است
زمان اجرا بسته به اینکه چند خوشه و کاربر انتخاب بشه بین 5 دقیقه تا یک ساعت متغیر هست
البته سرعت سیستم مورد استفاده هم موٍر هست/ کد فعلی روی یک سیستم متوسط به پایین اجرا میشه
نقد و بررسیها
هنوز بررسیای ثبت نشده است.