راهنمای گام به گام مانیتورینگ مدل یادگیری ماشین

نوشته شده توسط: نگین فاتحی

تاریخ انتشار: ۰۴ شهریور ۱۴۰۳

آخرین بروزرسانی: 23 دی 1403

زمان مطالعه: 8 دقیقه

مانیتورینگ مدل یادگیری ماشین، روشی برای اطمینان از پاسخ‌دهی دقیق ابزارهای مبتنی‌بر هوش مصنوعی است. نیاز ما به ارزیابی مجموعه داده‌های عظیم و نظارت بر مدل‌های یادگیری ماشین، ما را به نوشتن این مقاله ترغیب کرد. بنابراین در ادامه به تشریح یک نکته مهم، یعنی ارزیابی یک مدل در طول آموزش و پس از آموزش خواهیم پرداخت.

مانیتورینگ مدل یادگیری ماشین در طول آموزش با Callback

تصور کنید در حال پختن کیک هستید. اگر ابزارهای کوچکی در آشپزخانه داشته باشید که مراقب فر و حرارت آن باشند، کارتان بسیار ساده خواهد شد. آن‌ها می‌توانند به شما هشدار دهند که کیک بیش‌ازحد بالا آمده است، در حال سوختن است یا این‌که همه‌چیز به‌خوبی پیش‌ می‌رود.

در دنیای یادگیری ماشین، “Callback” همان ابزارهای کوچک و راهنمای کیک‌پزی هستند که به ما کمک می‌کنند بر روند آموزش مدل نظارت داشته و آن را کنترل کنیم. این یاری‌رسان‌ها در فریمورک‌های یادگیری عمیق مانند “TensorFlow Keras” و “PyTorch” اثرگذاری بیشتری دارند.

چرا از Callback برای مانیتورینگ مدل یادگیری ماشین استفاده کنیم؟

به فرآیند آموزش یک مدل، مانند سفر طولانی با ماشین نگاه کنید. به احتمال زیاد، ساعت‌ها بدون توقف رانندگی نمی‌کنید که درستی یا نادرستی مسیر را تشخیص دهید.

Callbackها مانند ایستگاه‌هایی برای بررسی نقشه، سوخت‌گیری یا حتی تغییر مسیر در صورت لزوم هستند.

به‎عنوان مثال اگر عملکرد مدل در حال بهبود نباشد، می‌توانیم از یک “Callback” برای توقف خودکار آموزش استفاده کنیم. از سوی دیگر، اگر فرآیند یادگیری مدل متوقف شده است، می‌توانیم از یک “Callback” دیگر برای تنظیم برخی پارامترها استفاده کنیم. سپس ازسر‌گیری بهبود یا توقف آن را زیرنظر بگیریم.

۵ روش برای مانیتورینگ مدل یادگیری ماشین حین آموزش

در این بخش به هشت Callback مهم در مانیتورینگ مدل یادگیری ماشین می‌پردازیم.

توقف زود هنگام

“Early Stopping” مانند یک ساعت زنگ‌دار هوش‌مند برای مدل شما عمل می‌کند. تصور کنید در حال مطالعه برای یک امتحان مهم هستید. در ابتدا سرعت یادگیری شما بالاتر است؛ اما پس از مدتی خسته می‌شوید و دیگر قادر به پردازش و ذخیره اطلاعات نیستید. “Early Stop” این لحظه را می‌شناسد و می‌گوید: «برای امروز کافی است!»

توقف زودهنگام در فرآیند آموزش یک مدل سهیم شده و بر عملکرد آن حین آموزش نظارت می‌کند. اگر مدل برای تعداد معینی از دوره‌ها (دوره‌های کامل آموزش) از بهبود بازماند، توقف زودهنگام آموزش را متوقف می‌کند. این موضوع از بیش‌برازش (Overfitting) مدل جلوگیری می‌کند؛ موقعیتی که در آن، مدل به‌جای یادگیری الگوهای عمومی، داده‌های آموزشی قبلی را حفظ می‌کند.

می‌توانید برای این Callback، یک پارامتر “Patience” تعیین کنید. به‌عنوان مثال، اگر این پارامتر را روی پنج تنظیم کنید، فرآیند به شکل زیر انجام می‌شود:

مدل قبل از تصمیم به توقف، برای پنج دوره دیگر بدون بهبود به یادگیری ادامه می‌دهد.

Model Checkpointing

مدل “Checkpointing” مانند عکس گرفتن از کیک در مراحل مختلف پخت آن است. این متد در حین آموزش، وضعیت مدل را در نقاط مختلف پیشرفت ذخیره می‌کند.

Checkpointing رویکردی مفید است؛ چراکه گاهی اوقات احتمال بدتر شدن عملکرد مدل پس از یک نقطه خاص بالا می‌رود. با “Model Checkpointing”، همیشه بهترین نسخه مدل خود را خواهید داشت؛ حتی اگر آموزش بیش‌از زمان درنظر گرفته‌شده ادامه یابد.

می‌توانید این مدل را روی دو حالت پیکربندی کنید:

ذخیره عملکرد مدل بعد از هر دوره
ذخیره فرآیند فقط زمانی که بهبود قابل‌توجهی در عملکرد مدل حاصل شد.
زمان‌بندی میزان یادگیری

“Learning Rate Scheduling” مانند تنظیم حرارت اجاق گاز در زمان پخت‌وپز است؛ در ابتدا ممکن است از حرارت بالا برای جوشاندن سریع آب استفاده کنید؛ اما در ادامه حرارت را کم می‌کنید تا مواد غذایی به‌آرامی بپزند.

رویکرد زمان‌بندی میزان یادگیری هم با تنظیم پارامتر “Learning Rate”، همین کار را در زمان آموزش مدل انجام می‌دهد. در ابتدا، نرخ بالا به مدل اجازه می‌دهد تا به‌سرعت از داده‌های ارائه‌شده یاد بگیرد. سپس با پیشرفت آموزش، نرخ پایین‌تر به مدل کمک می‌کند تا تنظیمات دقیق‌تری را روی فرآیند انجام دهد.

این شیوه زمانی بیشترین اثربخشی را دارد که مدل در فرآیند یادگیری، دچار چالش و ادامه مسیر می‌شود. کاهش نرخ یادگیری در این مرحله می‌تواند به مدل فشاری وارد کند که برای ادامه بهبود، به آن نیاز دارد.

Logging

“Logging” مانند نگه داشتن یک دفتر خاطرات با تمام جزئیات سفر یادگیری شما است. این روش معیارها و آمارهای مختلفی را در طول آموزش مدل ثبت می‌کند.

Logging می‌تواند شامل مواردی مانند دقت مدل برای هر دوره، مقادیر مجاز برای از دست دادن، نرخ یادگیری فعلی و هر اطلاعات مهم دیگری باشد. داشتن این سوابق برای تجزیه‌وتحلیل‌های بعدی در فرآیند آموزش بسیار مفید است؛ مثل نگاه کردن به گذشته و دیدن کل مسیری که طی کرده‌اید. Logging درک این‌که مدل در چه بخش‌هایی پیشرفت کرده و کجا با مشکلات روبه‌رو شده است را ساده می‌کند.

Tensor Board Integration

“TensorBoard” مانند داشتن یک کنترل پنل برای مدل شما عمل می‌کند. این روش مانیتورینگ مدل یادگیری ماشین را در زمان واقعی و نحوه پیشرفت آموزش ارائه می‌دهد.

TensorBoard مانند داشبورد کنترل پرواز در هواپیما است؛ تمام گیج‌ها و نمودارهایی که ارتفاع، سرعت، سطح سوخت و غیره را نشان می‌دهند، توسط این داشبورد کنترل و نظارت می‌شوند. TensorBoard نمودارهایی از میزان دقت مدل در یادگیری، تلفات و سایر معیارهای مهم را نشان می‌دهد.

این رویکرد برای مدل‌های پیچیده که در آن نیاز به ردیابی بسیاری از چیزها در یک زمان دارید، مفیدتر از سایر روش‌ها است. با TensorBoard، می‌توانید ترندها و الگوهای پیچیده را به‌سادگی ببینید؛ ارقام و اعداد سختی که با نگاه کردن ساده به آن‌ها، هیچ درکی حاصل نمی‌شود.

۵ روش برای مانیتورینگ مدل یادگیری ماشین پس از آموزش

این مرحله برای سنجش عملکرد مدل پس از آموزش اجرا می‌شود که پنج نمونه از مهم‌ترین آن‌ها را در ادامه معرفی خواهیم کرد.

ارزیابی مجموعه تست

بعد از این‌که مدل آموزش را تمام کرد، وقت آن است که عملکرد آن را بررسی کنید. “Test Set Evaluation” مانند منتقد غذا است که کیک شما را می‌چشد. این مجموعه‌ها داده‌هایی هستند که مدل شما پیش‌تر ندیده است؛ نه در طول آموزش و نه در لحظه ارزیابی.

استفاده از یک مجموعه تست جداگانه بسیار مهم است؛ چون تخمین واقع‌بینانه‌ای از عملکرد مدل در دنیای واقعی ارائه می‌دهد.

معیارهای عملکرد

“Performance Metrics” مانند معیارهای مختلف برای قضاوت کیک شما هستند. همان‌طور که یک کیک را می‌توان براساس طعم، بافت، ظاهر و غیره قضاوت کرد، یک مدل را هم می‌توان با معیارهای مختلف ارزیابی کرد.

برای مشکلات طبقه‌بندی – مانند تصمیم‌گیری در مورد این‌که تصویر یک گربه است یا سگ – از معیارهایی مانند “Precision”، “Recall” و “F1 Score” استفاده می‌کنیم.

در مثالی ساده، این فرآیند مانند ارزیابی خالص بودن طعم شکلاتی کیک (Precision)، برآورده کردن میل نسبت‌به شیرینی (Recall) و دریافت تجربه خوب حین خوردن کیک (F1 Score) است.

برای مشکلات رگرسیون مانند پیش‌بینی قیمت یک خانه، از معیارهایی مانند خطای میانگین مربع‌ها (MSE) یا خطای مطلق میانگین (MAE) استفاده می‌کنیم.

ماتریس سر درگمی

“Confusion Matrix” مانند یک کارت گزارش دقیق از بازدیدها و اشتباهات مدل است. این ماتریس می‌تواند برای یک مشکل طبقه‌بندی، موارد زیر را نشان دهد:

– چندبار مدل به تصویر گربه، گفت گربه (مثبت واقعی)

– چندبار به تصویر گربه گفت سگ (مثبت کاذب)

– چندبار وقتی تصویر سگ بود گفت سگ (منفی واقعی)

– چندبار به تصویر گربه گفت سگ (منفی کاذب)

این روش مانند دریافت یک بازخورد دقیق از هر فردی است که کیک شما را می‌چشید. او به شما نشان می‎دهد که چه چیزی را دوست دارد و چه چیزی را نمی‌پسندد.

تجزیه‌ و تحلیل خطا

“Error Analysis” مانند بررسی کامل تکه‌هایی از کیک است که به‌خوبی پخته نشدند. در این رویکرد، به مواردی که مدل شما در آن‌ها اشتباه کرده نگاهی می‌اندازید و سعی می‌کنید دلیل آن را پیدا کنید.

شاید مدل، گربه‌های پرشین را با نژاد تابی اشتباه می‎گیرد. شاید هم با عکس‌های گرفته‌شده در نور کم مشکل دارد. درک این خطاها می‌تواند بینش‌های ارزش‌مندی را در مورد چگونگی بهبود مدل ارائه دهد.

آزمون‌ های آماری

تست‌های آماری مانند استفاده از ابزارهای مناسب برای اندازه‌گیری کیفیت کیک هستند. آن‌ها کمک می‌کنند تا تفاوت در عملکرد بین مدل‌ها را بسنجید؛ این‌که آیا تفاوت‌ها قابل توجه و واقعی هستند یا ممکن است ناشی از شانس و تصادف باشند.

به‌عنوان مثال اگر یک مدل دقت ۸۲% و دیگری دقت ۸۰% داشته باشد، آزمون آماری به شما می‌گوید که این تفاوت واقعی و معنی‌دار است یا فقط یک نوسان تصادفی رخ داده است.

جمع بندی: مانیتورینگ مدل یادگیری ماشین

به‌کارگیری ترکیبی از استراتژی‌های مانیتورینگ مدل یادگیری ماشین، ارزیابی و نظارت کامل بر عملکرد درست آن‌ها را تضمین می‌کند. این رویکردها بینشی در مورد عملکرد مدل‌ها ارائه می‌دهند. به‌علاوه‌که قادر به اعمال و هدایت بهترین تنظیمات برای بهینه‌سازی فرآیند آموزش آن‌ها هستند. پیاده‌سازی Callbackهای مناسب در طول آموزش مدل و ارزیابی‌های جامع پس از آموزش، به ساخت مدل‌های قوی، دقیق و قابل‌اعتماد کمک می‌کنند.

نظر شما درباره این رویکردها چیست؟ فکر می‌کنید هر روش چه مزایا و معایبی دارد؟ در بخش نظرات دیدگاه خود را بنویسید تا با یکدیگر آن را بررسی و به افزایش دانش خود کمک کنیم.

معرفی نویسنده

مقالات

35 مقاله توسط این نویسنده

محصولات

0 دوره توسط این نویسنده

نگین فاتحی

از اسفند 99 مشغول گشت‌وگذار توی دنیای کلمات هستم؛ با این هدف که خوب بنویسم و این چشم‌انداز که کمک‌های موثری کنم. حالا سه‌ ساله که توی زمینه‌های گوناگون بازاریابی آنلاین مطالعه می‌کنم و یکی از حوزه‌های موردعلاقم، رفتارشناسی مخاطبان این فضا هست. دستاوردهای این مطالعه شده نوشتن محتوایی که امیدوارم شما بخونی، لُب‌کلام رو متوجه بشی، لذت ببری و با دست پر صفحه رو ترک کنی؛ شایدم بقیه نوشته‌هام رو بخونی :)