Naive Bayes چیست؟
به طور ساده روش بیز روشی برای دسته بندی پدیدهها، بر پایه احتمال وقوع یا عدم وقوع یک پدیدهاست.براساس ویژگیهای ذاتی احتمال(به ویژه اشتراک احتمال) نایو بیز با دریافت تمرین اولیه نتایج خوبی ارایه خواهد کرد. شیوه یادگیری در روش نایو بیز از نوع یادگیری با ناظر است.
برای نمونه یک میوه ممکن است پرتغال باشد. اگر نارنجی و کروی با شعاع حدود ده سانتی متر باشد. اگر این احتمالات به درستی به همدیگر وابسته باشند نایو بیز در تخشیص اینکه این میوه پرتغال است یا نه بدرستی عمل خواهد کرد.
برنامههای کاربردی بسیاری هستند که پارامترهای نایو بیز را تخمین میزنند، بنابر این افراد بدون سروکار داشتن با تئوری بیز میتوانند از این امکان به منظور حل مسایل مورد نظر بهره ببرند. با وجود مسایل طراحی و پیش فرضهایی که در خصوص روش بیز وجود دارد، این روش برای طبقه بندی کردن بیشتر مسایل در جهان واقعی، مناسب است.
KNN چیست؟
جستجوی نزدیکترین همسایه یا Nearest Neighbor، که همچنین با نام های جستجوی مجاورت، جستجوی همسانی یا جستجوی نزدیک ترین نقطه شناخته میشود، یک مسئله بهینه سازی برای پیدا کردن نزدیک ترین نقطهها در فضاهای متریک است.
مسئله بدین صورت است که: مجموعه S شامل تعدادی نقطه در یک فضای متریک مانند M و نیز یک نقطه ی پرس و جوی q∈ M داده شده است، هدف پیدا کردن نزدیک ترین نقطه در S به q است. در بسیاری از موارد، فضای M بصورت یک فضای اقلیدسی d-بعدی و فاصله بین نقاط با معیار فاصله اقلیدسی، فاصله منهتن یا دیگر فاصلههای متریک سنجیده میشود.
جستجوی k نزدیکترین همسایه، K همسایه نزدیک تر به نقطه پرس و جو را برمیگرداند. این روش معمولاً در تجزیه و تحلیلِ پیش بینی، به منظور تخمین و یا دسته بندی یک نقطه بر اساس اجماع همسایگان آن استفاده میشود. گراف k نزدیکترین همسایه گرافیست که در آن هر نقطه در گراف K نزدیک ترین همسایگان خود متصل است.
با توجه به مقدمه ای که در مورد این دو نوع دسته بند ذکر شد لازم به توضیح هست که یکی از محصولات سایت با عنوان “دسته بندی متون فارسی و سایر زبان ها” از دو روش فوق یعنی KNN وNavie Bayes برای دسته بندی استفاده می کنند.
میشه لطفا رفرنس رو هم بگید؟؟
ندارد :)
مطالب خوب هستن. ممنون میشم در مورد اینکه چطوری در رده بندی مدل انتخاب کینم توضیح بدهید.
زنده باشید. ببینید این صحبتی که می فرمایید سوال همه حتی اساتید هم هست. اینجاست که فرق کسی که تمرین و ممارست کرده با کسی که این کار رو نکرده مشخص می شه . در واقع وقتی با کسی که راه بلد باشه صحبت کنید و ایدتون رو مطرح کنید اگر راه بلد باشه می گه از فلان روش دسته بندی استفاده کن(نه فقط روش های دسته بندی) که هر روشی(روش های خوشه بندی؛ روش های پیش بینی و ...). اگر این طور فردی در اختیار ندارید مجبورید با مراجعه به رفرنس های مختلف در بیارید چه روشی برای چه کاری بهتره.