توضیحات کلی :
این پروژه تمامی بخش های سه پی دی اف (اینجا دانلود کنید) را به طور کامل انجام داده است. کار حرفه ای و به کمک زبان برنامه نویسی پایتون انجام شده است. در این پروژه به راحتی می توانید صفر تا صد یک پروژه پایتون حرفه ای را مشاهده و یاد بگیرید. در ادامه مواردی که به آن در این محصول پرداخته شده است به صورت کلی مشخص شده است :
۱- مشخصات کلی مجموعه داده
.۱ حوزه کاربرد (مثلا پزشکی، شبکه اجتماعی، فروشگاه و …)
.۲ چند جدول/فایل دارد؟ اسامی جدول ها/فایل ها؟
.۳ هر جدول/فایل حاوی چند ویژگی است؟ اسامی ویژگی ها؟
.۴ هر ویژگی از چه نوع است (انواعی که در مبحث داده کاوی شناخته اید)
.۵ نمودار ER یا class diagram را ترسیم کنید
.۶ زبان مجموعه داده؟ (فارسی/انگلیسی)
.۷ مجموعه داده را از چه طریق به دست آورده اید؟ (از سایت ها دانلود کرده اید یا خودتان جمع آوری کرده اید؟)
– اگر دانلود کرده اید آدرس دقیق آن را ارسال کنید
– اگر جمع آوری کرده اید، در خصوص نحوه جمع آوری گزارش دهید
۲- مشخصات صورت مسئله
.۱هدف خود از بررسی این داده را توضیح دهید. به دنبال یافتن چه چیزی هستید؟
o چه سوال/سوال هایی را می خواهید پاسخ دهید؟
o چه چیزی به شما برای این مسئله انگیزه بخش بوده است؟
.۲ مسئله شما فکر می کنید با چه روشی از داده کاوی حل می شود؟
o قوانین انجمنی؟
o دسته بندی؟
o خوشه بندی؟
۴- سوال های طبقه بندی – Classification
.D کدام ویژگی ها از مجموعه داده برای طبقه بندی مورد استفاده قرار می گیرد؟ و کدام ویژگی برچسب کلاس است؟ نوع آن جیست؟
.۱ نام ویژگی ها
.E تعداد رکوردهای اولیه داده شما چه تعدادی است؟
.F به ازای هر ویژگی )در صورت امکان، با توجه به نوع ویژگی( توصیف آماری ارائه دهید:
۱٫ بازه مقادیر هر ویژگی را مشخص کنید
۲٫ میانگین – میانه – مد – کمترین مقدار – بیشترین مقدار
۳٫ آیا مقادیر هر ویژگی متقارن است یا نامتقارن؟ با رسم نمودار هیستوگرام مشخص کنید )یادآوری فصل ۲ )
۴٫ پراکندگی داده ها را به ازای هر ویژگی محاسبه کنید )نمودار جعبه ای رسم شود(
۵٫ همبستگی دو به دوی بین ویژگی هایی که برای طبقه بندی )همه ویژگی ها به جز class label ( استفاده می کنید را بدست آورید. چه نتیجه ای می گیرید؟
استفاده از همه ویژگی ها الزامی است؟
.G آیا داده ناکامل و ناقص، نویز و ناسازگاری در داده ها وجود دارد؟ چگونه آن را شناسایی کردید؟ چه برخوردی با آن دارید؟
.H چه اقداماتی را برای پیش پردازش داده انجام داده اید؟ هر یک را به طور دقیق توضیح دهید
یا آن ها را بر روی داده بررسی کرده اید و نیازی به انجام اقدام خاصی نداشته است.
۵- سوال های طبقه بندی – Classification – فاز سوم
بعد از پیش پردازش نهایی داده، سایز داده را مجدد اعلام کنید.
.J با استفاده از ابزار داده کاوی به سوالات زیر پاسخ دهید )در هر جا که لازم است از تصاویر مربوط به برنامه استفاده کنید(
.۱ الگوریتم مورد نظر برای طبقه بندی شما کدام است؟ چرا؟
.۲ آیا الگوریتم های طبقه بندی دیگری در ابزار شما وجود دارد؟ تفاوت این الگوریتم ها چیست؟ )از لحاظ تنظیمات، ورودی یا خروجی مقایسه کنید(
.۳ چه تنظیمات خاصی برای الگوریتم مورد نظر شما باید انجام شود؟ توضیح دهید و انتخاب های خود را بگویید.
.۴ نسبت داده یادگیری به آزمون چقدر است؟
.۵ اگر بخواهیم طبقه بندی را مبتنی بر k-fold cross validation fold cross validation fold cross validation fold cross validation fold cross validation fold cross validation fold cross validation fold cross validation fold cross validation انجام دهیم، آیا این امکان در ابزار وجود دارد؟ چگونه؟ اگر وجود ندارد، یک راه
حل برای انجام آن پیدا کنید و این کار را انجام دهید )مثلا تقسیم کردن داده در اکسل(
.۶ مدل طبقه بند خود را با الگوریتم مورد نظر بر روی داده یادگیری بسازید.
.J با استفاده از ابزار داده کاوی به سوالات زیر پاسخ دهید )در هر جا که لازم است از تصاویر مربوط به برنامه استفاده کنید(
.۸ مدل ایجاد شده را توصیف کنید. آیا می توانید قوانین طبقه بندی را از مدل استخراج کنید؟
.۹ کیفیت طبقه بند چگونه است؟ معیارهای ارزیابی مورد استفاده برای بیان کیفیت طبقه بند کدام هستند؟ آن ها را اندازه گیری کنید. )حداقل
دقت، بازخوانی و معیار F ( مقدار این معیارها را بر روی داده یادگیری محاسبه کرده اید یا داده آزمون؟ چگونه؟ توضیح دهید
.۱۰٫۱۰ زمان اجرای روش خود را بر حسب ثانیه گزارش دهید.
.K )فعالیت اختیاری( از یکی دیگر از الگوریتم های طبقه بندی استفاده کنید و نتایج آن را با نتایج روش اصلی خود مقایسه کنید.
.۱ مقایسه تنظیمات، مقادیر معیارهای ارزیابی، نوع مدل ایجاد شده
.L ابزار داده کاوی خود را معرفی کنید و پیش نیازهای نصب آن را توضیح دهید.
.M فرایند داده کاوی خود را ترسیم کنید )نمودار مفهومی(
محتوای محصول :
۱- ۵ ویدیو از مواردی که نیاز به توضیح دارند
۲- داکیومنت تشریحی با فرمت ورد برای سه فاز پروژه
۳- دیتاست و موارد ضمیمه
دیدگاهها (0)
نقد و بررسیها
هیچ دیدگاهی برای این محصول نوشته نشده است.