محتوای محصول: دیتاست اسپلیت شده ناسا به همراه نرم افزار استخراج تمامی ویژگی های هر سطر از لاگ
خروجی تولیدی از نرم افزار: یک فایل اکسل حاوی تمامی ویژگی های معنی دار هر سطر از لاگ فایلها
تعداد رکوردها قبل از پیش پردازش اولیه و فیلتر کردن اطلاعات نامناسب مانند روبات ها: بیش از یک میلیون رکورد
توضیحات بیشتر:
دیتاست ناسا یک دیتاست بسیار قدیمی و در عین حال بسیار پرکاربرد در وبکاوی می باشد. به کمک این دیتاست می توان پیش پردازش های خوبی بر روی داده ها داشت. مقالات زیادی وجود دارند که از این دیتاست استفاده می کنند. پردازش این دیتاست بخاطر حجم زیادی که دارد سخت است و ما آن را به ۸۱عدد فایل با اندازه ۱٫۵ مگابایت تقسیم کرده ایم و ابتدا و انتهای آن را ویرایش کرده و آماده برای پیش پردازش می باشد.
این دیتاست حاوی لاگ های وب سرور سایت ناسا می باشد که در سالها قبل تولید شده است.
ویژگی های زیادی در هر رکورد از این دیتاست وجود دارد که شامل
ادرس آی پی یا نام دی ان اسی درخواست دهنده
تاریخ و ساعت درخواست صفحه
آدرس و نام صفحه
نوع ارسال صفحه مثلا گت یا پست و …
بایت ارسالی و …
دارد.
برخی از مقالات خود بنده هم که در بخش مقالات وجود دارد از این دیتاست استفاده میکند.
به همراه این محصول یک نرم افزار کوچک به زبان سی شارپ تعبیه شده است که تمامی فایل ها را به ترتیب می خواند و پس از تقسیم ویژگی ها آنها را در یک فایل اکسل بر اساس تمامی ویژگی هایی که دارد قرار می دهد و به عنوان خروجی با پسوند سی اس وی نمایش می دهد.
خروجی:




سرکاکی –
سلام. برای انجام پایان نامه ام احتیاج به پیاده سازی در متلب با دیتا ست ناسا دارم. با خرید این پگیج “۸۱ عدد لاگ فایل ناسا به همراه کد ساخت اکسل” میتونم ازش استفاده کنم؟مناسب هست؟
خود شما کار پیاده سازی انجام میدید؟ در زمینه سیستم های توصیه گر مبتنی بر کاربرد با زنجیره مارکوف هست
مهدي مقيمي –
سلام بنده در خدمتتون هستم. لطفا در تلگرام پیام بدید به ادرس research_moghimi@