دیتاماینینگ یار

پیشینه پژوهش

نویسنده برای حل مشکل مقیاس پذیری از روش فیلتر مشارکتی ، الگوریتم فیلتر مشارکتی مبتنی بر کاربر را در یک سیستم عامل محاسبات ابری توزیع شده که Hadoop است ، پیاده سازی می کند. 

نویسنده روی توصیه های سفر شخصی متمرکز شده است و برنامه های امیدوارکننده را با استفاده از عکس هایی که به صورت رایگان در دسترس جامعه قرار می گیرند نشان می دهد. آنها پیشنهاد می کنند توصیه های سفر سفارشی را با در نظر گرفتن پروفایل های کاربر خاص یا انواع خاص گروه های مسافرتی (به عنوان مثال ، خانواده ، زوج و دوستان) هدایت کنید.مزایای این روش عبارتند از

نویسنده رویکردی را ارائه می دهد که شامل فیلتر مشارکتی از آیتم به آیتم ، برای کشف فیلم های جالب و معنادار در بین مقیاس های وسیع فیلم ها است و این روش در Qizmt اجرا می شود که یک چارچوب.NET MapReduce است.  مزایای این رویکرد عبارت است از:

نویسنده روش KASR چهارم را برای توصیه شخصی ارائه داده است. در اینجا از الگوریتم فیلتر مشارکتی مبتنی بر کاربر استفاده شده است. برای اینکه این روش موثرتر و مقیاس پذیر باشد ، آن را در Hadoop اجرا می کنند. برای ارزیابی از ضریب جاکارد و اندازه گیری شباهت Cosineاستفاده می شود. آنها نشان می دهند که روش توصیه پیشنهادی بهتر از روشهای سنتی فعلی است.

همچنین برخی از معایب مربوط به این موارد وجود دارد مانند:

نویسنده یک روش خوشه بندی جدید ساخته شده بر اساس مدل رگرسیون کلاس LCRM) Latent) را پیشنهاد کرده است که اساساً آماده است تا هم رتبه بندی های کلی و هم مقادیر نظر سطح ویژگی (همانطور که از بررسی های متنی استخراج شده است) در نظر بگیریم تا یکدستی  تمایل داوران را مشاهده کنیم. در بررسی و محک، الگوریتم توصیه گر پیشنهادی را با دو مجموعه داده واقعی امتحان کردند. علاوه بر آن ، آنها آن را با روشهای مختلف مرتبط ، از جمله روش مبتنی بر عدم بررسی و تغییرات مبتنی بر غیر LCRM مقایسه کردند.سیستمی را پیشنهاد میکند که مکان را به عنوان یک ویژگی برای ارائه توصیه به کاربران در نظر می گیرد.

۱٫ برای خدمات خاص مکان بهتر است. ۲٫ هزینه انتقال را کاهش می دهد.

  1. در جایی مناسب نیست که مکان از ویژگی های مورد توجه نباشد. ۲٫ فقدان محاسبه همگون بنابراین برای مجموعه داده های بزرگتر مناسب نیست.

آنها روش توصیه گری را پیشنهاد می دهند که تمایز بین بازخوردهای مشتری  برای تشخیص تمایل مشتری رابررسی میکند . این تکنیک ها رتبه بندی واضح را در نظر می گیرند ، فعالیتی که می تواند مسئله پراکنده بودن داده ها را گزارش کند. با توجه به این تکنیکها ، آنها همچنین یک تحقیق آزمایشی درباره بازخوردهای مشتری-رستوران آنلاین برای ساخت رستوران RS و نمایش کارآیی روش پیشنهادی انجام می دهند.آنها یک روش فیلتر اشتراکی برای ایجاد پیشنهاد برای ایتم های مختلف با استفاده از رتبه بندی ها و بازخورد های قابل دسترسی در توییتر پیشنهاد دادند. آنها بازخوردهای داده شده توسط blipper (وب سایت بازخورد) را برای چهار محصول منحصر به فرد با استفاده از روش CF ارزیابی کرده اند.

کارهای اولیه در مورد توصیه کنندگان با استفاده از فیلتر مشارکتی بود که مقالات خبری را به کاربران توصیه می کرد  و آلبوم موسیقی و توصیه های هنرمند از اطلاعات اجتماعی  را توصیه می کند. این کار در زمینه سیستمهای پیشنهادی انجام شد که به کاربران کمک کرد با استفاده از الگوریتم های مختلفی که کاربران مختلف و ایتم هایی برای ارائه پیشنهادات مناسب را مورد بررسی قرار می دهد محصولات ، خدمات یا مطالبی مانند کتاب ، فیلم ، موسیقی ، نمایش تلویزیونی ، محصولات الکترونیکی یا دیجیتال و غیره را پیدا کنند…آثار پژوهشی در زمینه سیستم های پیشنهادی بر اساس نوع آن در این مقاله سازمان یافته است.

A : فیلتر مشارکتی

عمده کارها در سیستمهای پیشنهادی بر تکنیکهای مبتنی بر فیلتر اشتراکی متمرکز است. اثری که توسط Sarwar et al  ارائه شده است ، از کل بانک اطلاعاتی کاربر استفاده می کند و همچنین از روشهای آماری در بانک اطلاعاتی برای یافتن کاربران مشابه که علاقه مشابهی دارند استفاده می کند. G Zhuo و همکارانش  چارچوبی را ارائه می دهند که ترکیبی از فیلتر مشارکتی و استدلال مبتنی بر مورد برای بهبود توصیه های سیستم است. آنها برای اطمینان از عملکرد بهتر از دو الگوریتم مختلف MIFA و RAA استفاده کرده اند.در این روش قادر به پیش بینی آراء کاربر فعال مبتنی بر اطلاعات جزئی در مورد کاربر و وزنهای محاسبه شده از بانک اطلاعاتی کاربر بود. Konstan و همکارانش از محاسبه ضریب همبستگی پیرسون برای محاسبه وزنی که ارتباط بین کاربر فعال و سایر کاربران را نشان می دهد استفاده کردند. یک فیلتر مشارکتی شخصی که  ارائه شده است که در مورد خدمات وب که با محاسبه شباهت ها اجرا می شوند ، اعمال می شود. یک تکنیک ترکیبی مشارکتی توسط آنها ساخته شده است که ترکیبی از هر دو مفهوم کاربر و ایتم است. Qian Wang و همکارانش  یک مدل کاربر ایجاد کردند که از ترکیبی از اطلاعات جمعیتی و ویژگی های ترکیبی از موارد استفاده می کند.

این مدل در جستجوی مجموعه ای از کاربران همسایه است که علاقه مشابهی دارند. دقت با استفاده از الگوریتم ژنتیک برای محاسبه وزنهای مشابه شباهت در بین کاربران بهبود می یابد. فیلترینگ انجمن خوشه ای (ACF) ارائه شده است که از ماتریس رتبه بندی برای ایجاد مدل های خوشه ای استفاده می کند و فرض می کند کاربران در یک خوشه یکسان دارای علایق مشابهی هستند و کاربران مختلف در خوشه های مختلف علایق کمتری دارند. پیش بینی رتبه بندی ناشناخته در صورتی امکان پذیر است که یک ایتم در یک خوشه دارای رتبه بندی بیشتری به اعتبار خود داشته باشد. همچنین قادر خواهد ساخت به استنباط نتیجه گیری در مورد آیتم استفاده کنید. این به خوبی در یک مجموعه داده پراکنده کار می کند. یک رویکرد ترکیبی آبشاری ارائه شده است که ترکیبی از ویژگی ها ، اطلاعات جمعیتی و رتبه بندی های مربوط به یک ایتم است و ادعا می شود که نواقص فیلترهای مشارکتی و مبتنی بر محتوا را برطرف کرده است. روشی که ارائه شده است ، مفهوم  زمان متن را به الگوریتم فیلتر مشارکتی  اضافه می کند. این پیشرفت باعث بهبود عملکرد و دقت توصیه ها شده است. Ibrahim وهمکارانش هم روش دیگری را ارائه کرده اند که بر روی داده های پراکنده موثر است و برای ارائه نتایج بهتری میتوان  از ترکیبی از داده های جهانی و مقادیر مبتنی بر ایتم استفاده کرد. این امتیاز در مخالفت به رتبه بندی های صریح و معمول استفاده شده است. نتایج نشان داد بهبود قابل توجهی نسبت به سیستم Netflix برای توصیه‌های فیلم وجود دارد. نتفلیکس همچنین یک رقابت بسیار محبوب  با هدف بهبود الگوریتم موجود خود انجام داد.

B : فیلترینگ مبتنی بر محتوا

انتظار می رود که نخستین کارهایی که در زمینه فیلتر محتوا انجام شده است ، همکاری و کمک باشد که تکنیک های بازیابی و فیلتر اطلاعات بوده و بعداً توسط سایر محققان گسترش یافته است تا نوآوری های بیشتری را ارائه دهد. به طور معمول از تکنیک های مبتنی بر محتوا برای توصیه های آنها بر روی داده های مبتنی بر متن استفاده می شود و محتوا که به طور عمده توسط کلمات کلیدی کمک می شود. سیستم Fab که توسط M. Balabanovic و همکاران پیشنهاد شده است صفحات وب را توصیه می کند و با ارائه محتوای صفحه وب با ۱۰۰ کلمه کلیدی ، به توصیه خود می رسد.  بار دیگر که اسناد را توصیه می کند از ۱۲۸ کلمه مفید برای نمایش سند استفاده می کند. اهمیت یک کلمه کلیدی با استفاده از یک طرح سنجش وزن محاسبه می شود که از بسیاری جهات قابل اجرا است ، اما محبوب ترین آن عبارت از اندازه گیری فرکانس اسناد / فرکانس اسناد معکوس (TF-IDF) است. سیستم پیشنهادی مبتنی بر محتوا ، توصیه های خود را عمدتا بر اساس رتبه های قبلی کاربر ارائه می دهد و از این رو یک پروفایل مبتنی بر محتوا را برای هر کاربر حفظ می کند. کار دیگر [۳۴] احتمال  ایتم مورد علاقه کاربر را  با استفاده از طبقه کننده بیزی تخمین میزند. اگر یک مورد بسیاری از ویژگی ها را ذکر کرده باشد ، اثر N. Littlestone و همکاران نتایج خوبی را به نمایش گذاشته است. روش های دیگر یادگیری ماشین مانند شبکه های عصبی و خوشه ای نیز می تواند مورد استفاده قرار گیرد . سایر کارها در زمینه بازیابی متن نیز به تحقیقات فیلتر بر اساس محتوا کمک کرده است ، یکی از این موارد فیلتر تطبیقی است که با اسکن یک به یک از اسناد و مدارک ، اسناد مربوط را شناسایی می کند. کار دیگر S.Robertson و S. Walker از آستانه ای برای تعیین ارتباط یک سند با کاربر استفاده می کند.

C - سیستمهای توصیه گر ترکیبی

سیستم پیشنهادی ترکیبی اخیراً محبوبیت خود را پیدا می کند زیرا تنها به یک روش محدود نمی شود و از ترکیبی از روش ها برای ارائه نتایج و دقت بهتر استفاده می کند. این روش قادر است با استفاده از یک روش واحد ، نقطه ضعف ناشی از آن را برطرف کند. رابین بورک  اظهار داشت که هر تکنیک ترکیبی که مورد استفاده قرار می گیرد ، تحت یکی از هفت دسته وزن ، سوئیچینگ ، مخلوط ، ترکیب ویژگی ها ، آبشار ، افزایش ویژگی ها و سطح متا قرار می گیرد. یک کار در  با استفاده از ترکیبی از تکنیک تجزیه ارزش افزوده و اطلاعات جمعیتی به منظور بهبود تکنیک فیلتر مشترک استفاده شده است . A.B. باراگنس – مارتینز و همکاران  روشی را ارائه کردند که خصوصیات فیلترهای مبتنی بر همکاری و محتوا را با هم ترکیب می کند. الگوریتم های ژنتیکی همچنین الهام بخش کارهای اانجام شده در مورد فیلترهای ترکیبی هستند. روش دیگری که توسط Al-Shamriو همکاران  پیشنهاد شده است ، سیستم ترکیبی است. این روش از یک رویکرد ژنتیکی مبتنی بر فازی استفاده کرده است. روشی که توسط M. Lee و Y. Woo نشان داده شد ، از همکاری شبکه های عصبی و مفاهیم فیلتر مشارکتی استفاده می کند. استفاده مؤثر از شبکه های بیزی در  برای اجرای یک روش ترکیبی با نتایج بهتر از طرح های مشارکتی یا مبتنی بر محتوا موجود در اجرای فردی مورد استفاده قرار گرفت. یک الگوریتم خوشه بندی مبتنی بر خوشه بندی مرکزی  (centering bunching)  برای پیاده سازی یک سیستم پیشنهادی شخصی ترکیبی مورد استفاده قرار گرفت. M. Saranya و T. Atsuhiro با استفاده از ویژگی های نهفته ، نسخه سیستم هیبریدی خود را ارائه دادند که بسیار مورد استقبال قرار گرفت.

ارتباط و مشاوره با شما ۰۹۳۶۷۹۳۸۰۱۸ در واتس اپ

دیدگاه‌ها (0)

*
*


پاسخ من را به ایمیلم ارسال کن

error: با عرض پوزش؛ لطفا از مطالعه مطالب لذت ببرید.