آموزش داده‌کاوی و کاربردهای آن [بخش سوم]

آموزش داده‌کاوی و کاربردهای آن [بخش سوم]

نوشته شده توسط: تیم فنی نیک آموز
تاریخ انتشار: ۲۲ بهمن ۱۳۹۹
آخرین بروزرسانی: ۱۷ تیر ۱۴۰۳
زمان مطالعه: 12 دقیقه
۵
(۱)

مقدمه

در یک مجموعه سه‌گانه قصد داریم در مورد داده‌کاوی صحبت کرده و یک پروژه واقعی را اجرا کنیم. در مقاله اول در مورد داده‌کاوی و انواع مسائلی که به کمک داده‌کاوی می‌توان حل کرد صحبت شد. در ادامه اجزای یک پروژه داده‌کاوی بررسی شد. در مقاله دوم با دید کاملاً عملیاتی به سراغ اجرای یک پروژه واقعی رفته و بر روی فاز فراخوانی داده‌های لازم برای انجام پروژه داده‌کاوی تمرکز کردیم. در مقاله سوم و آخر به سراغ تعریف مدل رفته و فرایند آموزش مدل را بررسی می‌کنیم.در مقاله قبلی Data Source View را ایجاد کرده و Data Source View در پنجره Solution Explorer قابل ‌مشاهده است. در وسط تصویر زیر، ستون‌ها را لیست شده در View مربوط به vTargetMail می‌بینیم. بسیاری از این ستون‌ها مثل First Name (نام) و Name Style (مدل نام) برای داده‌کاوی مفید نیستند. همچنین، ستون‌های اسپانیایی و فرانسوی تکراری هستند چون معادل انگلیسی آن‌ها وجود دارد. می‌توانیم ستون‌های خاصی که دوست داریم به‌عنوان ورودی الگوریتم شبکه عصبی داشته باشیم را در زمان ساخت مدل داده‌کاوی‌مان انتخاب کنیم یا می‌توانیم یک Named Query جدید برای محدودکردن ستون‌های در دسترس در Data Source View بسازیم.بر روی فولدر Mining Structures راست کلیک کنید و …New Mining Structure را انتخاب کنید تا Data Mining Wizard باز بشود.بر روی Next کلیک کنید.گزینه From Existing Relational Database or Data Warehouse را انتخاب کنید و سپس بر روی Next کلیک کنید.Microsoft Neural Network را به‌عنوان تکنیک داده‌کاوی انتخاب کنید.در صفحه Select Data Source View، Data Source View که قبلاً تعریف کرده‌ایم را استفاده می‌کنیم. بر روی Next کلیک کنید.سپس، تیک جعبه Case را برای خط ColumnsForDataMining بزنید. بر روی  Next کلیک کنید.در صفحه Specify the Training Data، در ستون Key جعبه معادل ستون CustomerKey  را تیک بزنید. برخی ستون‌های باقی مانده را به عنوان ورودی استفاده خواهند شد. ستون BikeBuyer برچسب دسته ما خواهد بود، پس تیک جعبه Predictable را برای ستون BikeBuyer را بزنید. بر روی Next کلیک کنید.مقادیر پیش‌فرض در پایین در صفحه Specify Columns’ Content and Data Type نشان‌ داده‌ شده‌اند. بر روی دکمه Detect کلیک کنید.
دقت کنید که نوع ویژگی‌های Bike Buyer (خریدار دوچرخه)، Number Cars Owned (تعداد ماشین‌ها)، Number Children At Home (تعداد فرزندان در خانه) و Total Children (تعداد کل فرزندان) از پیوسته به گسسته تغییر کرد. همچنین، نوع داده برای Bike Buyer (خریدار دوچرخه) را می‌توان از نوع Long به Boolean (بولی) تغییر داد چرا که مقادیر گسسته برای ستون Bike Buyer صفر و یک هستند. بر روی Next کلیک کنید. در این مسئله هدف پیش‌بینی خرید دوچرخه توسط افراد است.از ۳۰% داده خود برای آزمون صحت مدل کاوش استفاده می‌کنیم. بر روی Next کلیک کنید.در صفحه Completing The Wizard، می‌توانیم نام ساختار کاوش و مدل کاوش را تغییر بدهیم. سپس بر روی Finish کلیک کنید.ساختار کاوشمان در Solution Explorer ظاهر می‌شود.سربرگ Mining Structure (ساختار کاوش) به طور پیش‌فرض انتخاب شده است. بر روی سربرگ Mining Model Viewer کلیک کنید.وقتی پرسیده می‌شود ?Yes ،Would you like to build and deploy the project first را انتخاب کنیدزمانی که هشداری درباره زمانی که ممکن است طول بکشد تا مدل کاوش پردازش بشود، داده می‌شود و پرسیده می‌شود Do you wish to Yes ،Continue را انتخاب کنید. تعداد رکوردهای داخل View زیاد نیست، پس‌پردازش نباید بیش از یک دقیقه طول بکشد.وقتی پنجره Process Mining Model ظاهر می‌شود، دکمه Run را بفشارید.پنجره Process Progress ظاهر خواهد شد. زمانی که پردازش با موفقیت به پایان می‌رسد Close را در پنجره Process Progress انتخاب کنید و دوباره در پنجره Process Mining Model بر روی Close بزنید.بسته به پیکربندی سخت‌افزارتان، پنجره Load Mining Model Content ممکن است ظاهر بشود با شروع به …Please Waitسپس پنجره Deployment Progress ظاهر خواهد. حال در سربرگ Mining Model Viewer، می‌توانیم ببینیم کدام ویژگی‌ها و مقادیرشان تأثیر بیشتری در دسته‌بندی غلط False (non-buyer خریدار نیست) و کدام ویژگی‌های و مقادیرشان تأثیر بیشتری در دسته‌بندی صحیح True (Buyer خریدار) دارند.
بر روی نمودار صحت کاوش Mining Accuracy Chart کلیک کنید و سپس بر روی صفحه ماتریس دسته‌بندی Classification Matrix کلیک کنید، می‌توانیم ماتریس درهم‌ریختگی (Confusion Matrix) را برای الگوریتم شبکه عصبی ببینیم. این ماتریس تعداد مثبت درست (True Positive)، منفی درست (True Negative)، مثبت نادرست (False Positive) و منفی نادرست (False Negative) را نشان می‌دهد.

چه رتبه ای می‌دهید؟

میانگین ۵ / ۵. از مجموع ۱

اولین نفر باش

title sign
دانلود مقاله
آموزش داده‌کاوی و کاربردهای آن [بخش سوم]
فرمت PDF
9 صفحه
حجم 1 مگابایت
دانلود مقاله
title sign
معرفی نویسنده
تیم فنی نیک آموز
مقالات
402 مقاله توسط این نویسنده
محصولات
0 دوره توسط این نویسنده
تیم فنی نیک آموز
title sign
معرفی محصول

دوره یادگیری علم داده

1.780.000 تومان 1.246.000 تومان
title sign
دیدگاه کاربران