پروژه کامل رپید ماینر در زمینه طبقه بندی متون فارسی به همراه دیتاست اشانتیون (۱۰ هزار خبر از روزنامه همشهری) – در واقع این پروژه یک سیستم توصیه گر برای طبقه بندی متون فارسی هست. دیتاست حاوی دو ستون می باشد. ستون اول شامل متن خبر و ستون دوم لیبلی که به این خبر زده شده را شامل می شود.به همراه این پروژه داکیومنت فارسی و کامل ارائه شده است. به جهت آشنایی با رپیدماینر از پست های دیگر سایت دیدن کنید.در فاز پیش پردازش این کارها انجام شده است : الف: تبدیل هریک از متون به برداری از کلمات که به کمک کنترل قدرتمند Process Documents From Data در رپیدماینر انجام می شود.ب: پیدا کردن پایان جملات. در رپیدماینر به منظور بدست آوردن انتهای جملات می توان از دستورات Regex موجود در کنترل Tokenize استفاده کرد.د: تفکیک جملات از یکدیگر که به کمک کنترل Tokenize انجام می شود.ه: از بین بردن کلمات بیفایده به صورت دستی (حروف ربط، اضافه، نشانه، علایم نقطه گذاری، ضمایر، افعال ربطی، شبه جمله ها و با توجه به دو گروه کلمات ، افعال و … . این کار به کمک Filter Stop Words انجام می شود.و: انجام عملیات کاهش و ریشه یابی اسامی .به منظور عملیات کاهش از ابزار Stem استفاده شده است که به ریشه یابی کلمات می پردازد. همچنین به جهت فیلتر کلمات از ابزار Filter Token با اندازه کاراکتر های مابین ۴ الی ۲۵ استفاده شده است.پس از آن دیتاست کاملا پالایش شده آماده فید دادن به بخش آموزش می باشد. پیش از ادامه بحث در خصوص قسمت های اصلی فرایند پیش پردازش صحبت به میان خواهیم آورد.سپس اطلاعات توکنیزه شده و در مرحله بعدکاهش ابعاد رخ می دهد. سپس مدل طبقه بندی ایجاد شده و نتایج به خروجی منتقل می شود.خروجی برخی قسمت ها در زیر آمده است:
4 دیدگاه برای طبقه بندی متون فارسی با استفاده از الگوریتم SVM
مهدي مقيمي (مالک تایید شده)–
با سلام
تشریف بیارید واتس اپ یا تلگرام به شماره ۰۹۳۶۷۹۳۸۰۱۸
امتیاز 5 از 5
زینب –
با سلام
من بدنبال فایل رپید ماینر داده و فایل پروسس هستم به همراه ادرس کتابخانه ها و لایبرری های مورد نیاز که در ان چند متن فارسی رو با هم وارد رپید ماینر کرده و طبقه بندی کنم .
مهدي مقيمي (مالک تایید شده)–
با سلام
در همه پروژه های مرتبط با کار شما آموزش کامل وجود داره که چطور با پروژه کار کنید. و فایل ها و … نیز وجود دارد
با تشکر
امتیاز 5 از 5
احمد –
سلام ووقت بخیر ممنون ازپاسخ گوییتون ،درست میفرمایید کراس ولیدیشن داده هارو به ١٠قسمت و١قسمت رو به تست اختصاص میده ،من ازکسی که کار کرده بااین نرم افزار، شنیدم که میشده این نسبت رو تغییر داد،که گویا درورژن ٣.۶وکا دقیقا کنار قسمت k foldبوده ولی درورژن ٣.٨من ندیدم این قسمترو سوالم این بود که کدوم قسمت ؟؟وتحت چه عنوانی میتونم بهش دسترسی داشته باشم ؟؟
مهدي مقيمي (مالک تایید شده)–
سلام وقت بخیر
در فروشگاه پروژه های مرتبط زیاد هست
کافیه مشاهده بفرمایید
از کادر بالای سایت می تونید سرچ بفرمایید پروژه های وکا و این مورد در پروژه ها انجام شده است
امتیاز 5 از 5
پارسا –
سلام مهندس مقیمی
چند سوال در خصوص پروژه ایی که زحمت کشیدید داشتم
۱- کاهش ابعاد ویژگی که در توضیحات بالا اشاره کردید با چه اپراتوری در رپیدماینر انجام شده؟
۲- تعداد صفحات داکیومنت پروزه چند صفحه است؟ و اینکه آیا شما روی همین پروژه وقت نوشتن پایان نامه رو هم دارید؟
مهدي مقيمي (مالک تایید شده)–
سلام وقت بخیر
۱- کاهش ابعاد با فیلترهای موجود در خود text processing رپیدماینر انجام شده و کد نویسی خاصی انجام نشده
۲- تعداد صفحات این داکیومنت با فونت ۱۴ ده صفحه است
مهدي مقيمي (مالک تایید شده) –
با سلام
تشریف بیارید واتس اپ یا تلگرام به شماره ۰۹۳۶۷۹۳۸۰۱۸
زینب –
با سلام
من بدنبال فایل رپید ماینر داده و فایل پروسس هستم به همراه ادرس کتابخانه ها و لایبرری های مورد نیاز که در ان چند متن فارسی رو با هم وارد رپید ماینر کرده و طبقه بندی کنم .
مهدي مقيمي (مالک تایید شده) –
با سلام
در همه پروژه های مرتبط با کار شما آموزش کامل وجود داره که چطور با پروژه کار کنید. و فایل ها و … نیز وجود دارد
با تشکر
احمد –
سلام ووقت بخیر ممنون ازپاسخ گوییتون ،درست میفرمایید کراس ولیدیشن داده هارو به ١٠قسمت و١قسمت رو به تست اختصاص میده ،من ازکسی که کار کرده بااین نرم افزار، شنیدم که میشده این نسبت رو تغییر داد،که گویا درورژن ٣.۶وکا دقیقا کنار قسمت k foldبوده ولی درورژن ٣.٨من ندیدم این قسمترو سوالم این بود که کدوم قسمت ؟؟وتحت چه عنوانی میتونم بهش دسترسی داشته باشم ؟؟
مهدي مقيمي (مالک تایید شده) –
سلام وقت بخیر
در فروشگاه پروژه های مرتبط زیاد هست
کافیه مشاهده بفرمایید
از کادر بالای سایت می تونید سرچ بفرمایید پروژه های وکا و این مورد در پروژه ها انجام شده است
پارسا –
سلام مهندس مقیمی
چند سوال در خصوص پروژه ایی که زحمت کشیدید داشتم
۱- کاهش ابعاد ویژگی که در توضیحات بالا اشاره کردید با چه اپراتوری در رپیدماینر انجام شده؟
۲- تعداد صفحات داکیومنت پروزه چند صفحه است؟ و اینکه آیا شما روی همین پروژه وقت نوشتن پایان نامه رو هم دارید؟
مهدي مقيمي (مالک تایید شده) –
سلام وقت بخیر
۱- کاهش ابعاد با فیلترهای موجود در خود text processing رپیدماینر انجام شده و کد نویسی خاصی انجام نشده
۲- تعداد صفحات این داکیومنت با فونت ۱۴ ده صفحه است