بخش کوچکی از کاربردهای وسیع علم داده
یکی از سوالاتی که هر شخصی در ابتدای فراگیری هر علمی از خود میپرسد این است که “آنچه میآموزم چه کاربردی دارد و شغل من در آینده چه خواهد بود؟”. در این بخش برآنیم تا طیف گستردهای از موارد استفادهی علم داده را بیان کنیم. شایان ذکر است که کاربردهای علم داده به قدری وسیع است که اکثر کارفرمایان و مالکین کسب و کار اطلاعی از اثرگذاری و منفعت این علم در کسب کار خودشان ندارند. و برخی حتی از چیستی علم داده آگاهی ندارند. پس یکی از وظایف دانشمند علم داده ارائهی مستندات و راه حلهای ملموس برای کارفرمایان و در نتیجه قانع کردن آنهاست.
شاخه فروش:
– تحلیل احساس مشتری:
تحلیل احساس “Sentiment Analysis” مبحثی بسیار گسترده است و امروزه در تحلیل اجتماع، پیشبینی وقایع و تحلیلهای پیچیده اجتماعی و سیاسی و پیش بینی آنها نقش مهمی ایفا میکند.
این مبحث یک باب نوین در علم نیست و سالهاست که درحال اجراست. اما با آمدن علم داده این کار با دقت بسیار زیادتر و در زمان کمتری انجام پذیر است. این بدین معنی است که دیگر نیازی به لیستهای نظر سنجی بلند بالا نیست که تقریبا هیچگاه به نتیجه صحیح و بازخورد قابل استناد نمیرسد؛ چرا که مشتریان علاقه به هزینه کردن زمان خود برای دادن بازخوردهای بلند بالا ندارند و اگر آنها را با روشهای گوناگون و غیر مستقیم مجبور به پاسخ دادن به سوالات کنیم، از دستشان میدهیم. امروزه این کار با تحلیل کامنتها و لایکهای مشتریان در فضای مجازی یا در محلهایی که برای “انتقاد و پیشنهاد انتخابی” در نظر گرفته شده ممکن است.
– کنترل بهینه موجودی یا انبار:
صاحبان کسب و کار همیشه به دنبال تامین محصول و یا اقلام مناسب، در زمان مناسب، با کیفیت مناسب و قیمت معقول هستند. داشن قیمت تمام شده معقول به عوامل زیادی بستگی دارد. بخشی از آن به زمان و مقدار خرید باز میگردد و بخشی دیگر به پیشبینی تلاطم بازار و پیشبینی نیاز مشتریان در آینده. زمانی که حرف از پیشبینی، کشف، تشخیص و یا بهینه سازی بر اساس چندین پارامتر و قوانین پیچیده به میان میآید، علم داده از اولین ابزارهای کاربردی و راه بهینه برون رفت از سردرگمی و تصمیمات اشتباه است.
به این منظور فرآیندهای زنجیرهی تامین و وقایع آن در کنار تجربیات و ذکاوت، منابع اصلی جمع آوری دادههای ما هستند. سپس روشهای آماری و الگوریتمهای مناسب برای یادگیری ماشین و همچنین رصد بازار و تغییرات آن ما را در یافتن راه حلهای مناسب در این مسئله یاری میدهد.
– بهینه سازی قیمت:
قطعا برای یکایک ما پیش آمده که از خریدی به علت قیمت “نامتناسب” آن منصرف شده باشیم. بر اساس آمار موجود جهانی، سیاست قیمتگذاری به علت پیچیده بودن و تعدد پارامترهای دخیل عمدتا به شکل ناقص تشخیص داده و وضع میشوند. این موضوع یکی از دلایل اصلی کم شدن سود سالانه معرفی شده است. گاهی یا بهتر است بگوییم در اکثر مواقع به علت نامعقول بودن و بالا بودن قیمت و در برخی دیگر از موارد به علت عدم سنخیت قیمت پایین و یا بالای کالا با سطح کیفی مورد انتظار، مشتری از خرید کالا منصرف میشود و به دنبال کالای جایگزین میرود. این دیدگاه از سمت خریدار، درکنار دیدگاه فروشنده که به دنبال افزایش مشتری و در عین حال حفظ سود است، چالشی جالب و رایج است.
پارامترها و شاخصهای گوناگونی در این مسئله دخیل اند و رسیدن به یک راه حل که بر حسب رویدادها و فصول مختلف، بهترین حالت فروش و رونق کسب را به همراه داشته باشد، نیازمند تحلیلهای گوناگون است. رفتار خریدار، زمان خرید، قیمت خرید اجناس از سمت فروشنده، شرایط بازار، رقابت، بحرانها و موارد متعدد دیگر در رسیدن به یک سلسله¬ی صحیح از تصمیمات و مجموعهای منعطف و قابل تطبیق از پارامترها و شاخصها، نیازمند مجهز بودن به علم داده است. این علم به ما امکانات حفظ مشتری با کمترین هزینه را میدهد.
تشخیص محل جغرافیایی کسب و کار:
- آیا میدانید مقدار سود از دست رفته به علت اشتباه انتخاب در مکان کسب و کار شما چقدر است؟
- چقدر از این سود از دست رفته به علت عدم وجود مشتریان مورد نظر شما در نزدیکی محل کسب شماست؟
- چه مقدار ازین سود از دست رفته به علت فاصلهی شما از مناطق اصلی ارائهی کالای مورد نظر شماست؟
- چه مقدار از سود ازدست رفته به علت شلوغی بیش از حد و نبود جای پارک در محل فعلی کسب و کار شماست؟
علم داده با توجه به انتخاب و نحوه تصمیم گیری مالکان کسب و کارهای مبتنی بر حضور مراجعین، بهترین راه تشخیص محل خرید و یا ساخت شعب شناخته شده است. با یک دید فنی جهت تشخیص بهترین محل جغرافیایی، دادههای فراوانی برای تحلیل و پردازش به نظر خواهد آمد.
راه حل این تشخیص، ساده اما بسیار موثر است. با مطالعه دادههای بهروز مشتریان، اطلاعات سرشماری و فراوانی تعداد اشخاص در هر محله با درنظر گرفتن ساعات حضور افراد و نوع مشغلهی آنها میتوان به محل جغرافیایی مناسبی که بیشترین پتانسیل را برای نوع کسب و کار مد نظرمان دارد، دست یافت. در نظر گرفتن موقعیت مکانی کسب و کارها با استفاده از دادههای موجود، کارفرما را از سرمایهگذاری اشتباه دور کرده و ایشان را به سمت بهینهترین انتخاب محل سوق خواهد داد.
– تحلیل تخلف در درخواست خدمات پس از فروش:
میدانیم که خدمات پس از فروش، برای فردی که ضمانت میدهد کم و یا بی هزینه نیست و بدیهی است که تخلفاتی در این زمینه به فراخور بعضی پارامترها از جمله ارزش کالا شکل میگیرد. کشف این گونه تخلفات و تحلیل کلیهی درخواستهای دریافت خدمات پس از فروش میتواند راهی برای بهینهسازی در زمان، هزینه، شهرت خدمات دهنده و دیگر موارد باشد.
این دست از تحلیل و تشخیصها خیلی ساده شکل نمیگیرد و شامل مراحل نسبتا پیچیده مثل دسته بندی مشتری، تحلیل صحت دسته بندی، کاهش آلارم های اشتباه “False Positive”، تقویت خصیصههای ممیزی، ذکاوت و آگاهی فرایندی و غیره می¬شود. همچنین از بعد فنی نیز پردازش متن، داده کاوی کلاسیک و آمار و احتمالات نیازمندیهای این گونه پروژهها هستند.
این روش الزاما مختص کالاهای گران قیمت و یا با تعمیرات پر هزینه نیستند. چرا که هزینه پاسخگویی، رسیدگی به درخواستها، حمل و نقل و برطرف کردن مشکل احتمالی هر کالایی بخش زیادی از هزینه¬ی کسب و کارها بوده و برای کارفرمایان قابل توجه است. با استفاده از علم داده میتوان هزینههای رسیدگی به درخواستها را معطوف به درخواست های مشکوک کرد و با توجه به شرایط، آنها را رد و یا مرتفع کرد.
– تحلیل سبد خرید:
تحلیل سبد خرید از سنتیترین و سادهترین مباحثی است که با علم داده بهینه شده است و شامل یادگیری از طریق روشهایی از جمله کشف رشته قوانین “Rule Mining” به انجام میرسد. در این شاخه، علاقهمندی و عدم علاقهمندی و مجموعهای از محصولاتی که بیشترین احتمال خریداری شدن را دارند قابل استخراج است. توابع وابستگی و قوانین انجمنی، عضوهای اصلی ساخت و یا کشف قوانین در این مسئله هستند. تولید محصولات در صورت وجود دادهی لازم در این گونه تحلیلها ممکن و شدنی است.
یکی از نکات چالشی در این گونه مسائل که عموما نادیده گرفته می-شود نحوهی سنجش نتایج نهایی قبل از ارائه به کارفرماست. چرا که توابع سنجشی در اینگونه مسائل رفتار عجیبی دارند و ممکن است ما را به اشتباه ساده با تبعات بسیار بزرگ مبتلا کنند. دقت داشته باشیم که در تحلیل سبد خرید، اشتباهات ما به عنوان دانشمند داده میتواند در مدت زمان کوتاهی آثار سوء خود را نشان دهند و سود نهایی کارفرما را کاهش دهند. بنابراین پیشنهاد میگردد علم لازم در این زمینه را پیش از انجام پروژهی کلان کسب کنید.
– سیستمهای پیشنهاد دهنده:
چه چیزی را به چه اشخاصی پیشنهاد دهیم یا چگونه تبلیغات را کمتر و در همان حال موثرتر کنیم؟ این سوال اصلی مدیران تبلیغاتی و مالکان کسب و کار است.
بهترین پیشنهاد، موثرترین تبلیغات، یافتن نیازمندی قطعی و یا احتمالی مشتری بر اساس رفتار مشتری، گروهبندی مشتریان بر اساس نیاز آنها، سلایق مشتریان و مواردی ازین دست تماما از اهداف بهینه سازان تمامی کسب و کارهاست. چنانچه بتوان موارد مذکور را تا حد معقولی شناسایی کرد، میتوان موتورهای پیشنهاد دهندهای تولید کرد تا با در نظرگرفتن این دادهها و الگوریتمهای مناسب بهترین پیشنهاد را به مشتری ارائه کند.
به مجموعه اقدامات فوق که درحال حاضر بازار گرمی دارد، سیستمهای پیشنهاد دهنده گفته میشود. اجرای این سیستم به دو شکل فیلترینگ با همکاری و فیلترینگ براساس محتوا انجام میشود. فیلترینگ بر اساس همکاری مبتنی بر شباهت سلیقه و شباهت رفتار مشتریان به یکدیگر است و فیلترینگ براساس محتوا مبتنی بر پیشینه و سلایق خود مشتری است.


شاخه رسانه:
– Customer Churn یا نگهداری مشتری:
دو مبحث اصلی در گسترش هر کسب و کاری اهمیت زیادی دارد؛ جذب مشتری و نگهداری آن. موضوعاتی که هردو هزینهبر هستند. در کنار این مباحث، متخصصین گسترش و بهبود کسب و کار به دنبال یافتن چگونگی اجرای این دو هستند و در مرحله بعد به دنبال بهینه کردن آنها.
بر اساس تجریبات و مدیریت دانش صورت گرفته توسط دانشمندان علوم داده، اولین شاخهی دستهبندی مشتری “Customer Segmentation” تشخیص جدید و یا قدیمی بودن مشتری است؛ در صورت جدید بودن مشتری ما زمان محدودی برای جذب بازدید کنندهی جدید وب سایت، کانال و یا محصول داریم. بنابراین باید براساس همان اطلاعات محدود اولیه¬ی مشتری، چه به صورت خود اظهاری و چه به صورت اطلاعات دریافتی غیر مستقیم تصمیم بگیریم. میتوانیم با در نظر گرفتن موقعیت جغرافیایی، بهترین مجموعه از تبلیغات و محتوا را به مشتری نشان دهیم و ایشان را در فکر به محصول و اتمسفر مدنظر خودمان نگه داریم. در مورد نگهداری مشتری مسئله کمی قابل تخمینتر است، چرا که ما رفتار مشتریان خود را در طول حضورشان در فضای کسب و کارمان میتوانیم رصد کنیم. در هر صورت با داشتن اطلاعات رفتار مشتری، پیشبینی آنکه چه خدماتی در آینده نزدیک و دور باب میل مشتری است، کار سختی نیست و با این عمل، احتمال وابسته شدن مشتری و حضور ایشان در کسب و کار مدنظر به صورت چشمگیری ارتقا خواهد یافت.
پیشبینی رفتار و سلیقهی مشتری، درک نظر واقعی مشتری با نوع حیاتی که مشتری در سیستمهای مختلف دارد میتواند، ما را در یافتن ” مسیر زندگی مشتری” یاری کند. هر مشتری در سیستم ما مسیر زندگی مختص خودش را دارد و ما انواع زیادی از مشتری داریم که هر کدام مسیر زندگی متفاوتی در سیستممان دارند. ما میتوانیم کشف کنیم که کدام مشتری، چقدر از مسیر زندگی پیشبینی شده فاصله گرفته و خارج از عرف عمل میکند، یا میتوانیم بفهمیم کدام مشتری نزدیک به پایان مسیر زندگی در سیستم است و چرا. در این مرحله با استفاده از ابزار و اطلاعات لازم از ترک سیستم توسط ایشان و از دست رفتن آنها جلوگیری میکنیم.
– تبلیغات هدفمند و مخاطب محور:
تبلیغات بخش موثر و پر هزینهی گسترش کسب و کارها است. احتمالا مشاهده کردهاید که در فرمهای مختلف سازمان ها و موسسات از شما میپرسند ” از چه طریق با ما آشنا شدید؟”. یکی از کارکردهای این سوال تحلیل این مسئله است که کدام یک از روشهای تبلیغاتی موثرتر از باقی آنها عمل کرده و با استفاده از این دانش، هزینهی تبلیغات با هدفمند شدنشان کاهش یابد.
حال چگونه میتوان مخاطب را شناسایی کرد و تبلیغات هدفمندی را به ایشان ارائه داد؟ بخش زیادی از پروژههای دستهبندی مشتری، تحلیل احساس مشتری، سیستمهای پیشنهاد دهنده، نگهداری مشتری و غیره دارای تحلیلها و فرایندهای مشترک هستند. بنابراین اکثر آنچه در این پروژهها انجام میشود، در پروژههای دیگر نیز کاربرد دارد.
جهت هدفمند شدن تبلیغات محتمل است که ما تصمیم به انجام “تحلیل احساس مشتری” بگیریم و خروجی این مرحله را در زیر سیستم نگهداری مشتری، پیش بینی رفتار آینده مشتری، سیستمهای پیشنهاد دهنده و تولید محتوای آینده استفاده کنیم. اما استفادهی نهایی ما تعیین کنندهی مسیر انجام پروژه و کنترل کیفیت ماژولهای خاص پروژه ما است.
– تحلیل محتوای مورد استفاده در رسانه:
به این سوالات دقت کنید. چه میخوانند؟ چه چیزی را دوست دارند و چه چیزی را دوست ندارند؟ چه نظری دارند؟ به دنبال چه هستند؟ کدام مطلب بر سر راهشان زیاد و اضافه است؟ و تاثیر کدام تا چه اندازه بهتر است؟
امروزه پیشبینی رفتار مخاطبان با تحلیل فضای مجازی و رفتار مشتری در شبکهی کسب و کار شخصی قابل تشخیص است. با مشخص شدن پاسخ این سوالات ما میدانیم جامعهی هدفمان کیست، چقدر است، موثرترین عامل بر روی آنها چیست و … با دانستن این موارد با کمترین هزینه، موثرترین موارد را تولید و یا به آنها پیشنهاد میدهیم و میدانیم از چه چیزی اجتناب کنیم.
در باب مهارت فنی لازم باید گفت که تکنینک کافی ودانش لازم درپردازش متن جزء ضروریات ماست که ارزش آن نیاز به یاداوری ندارد. درحال حاضر لایکها ، کامنتها، تاریخچهی کلیک بر روی آیکونهای سایت، علاقهمندی دوستان مجازی و چند مورد دیگر از مواردی است که برای پیشبینی و تحلیل رفتار مشتریان قابل دسترسی است.
– تحلیل در لحظه یا یادگیری جریانی:
در برخی کسب و کارها، به دلیل سرعت بالای تغییرات، دادهها به صورت لحظهای به سیستم اضافه میشوند؛ مانند قیمت طلا و دلار در بازار بورس جهانی. در این موارد نیاز به سیستمهای هوشمندی است که دادهها را به صورت Real Time پردازش و نتایج را بر روی تصمیمگیریها اعمال کند. هر تغییر و یا Content Drift در این سیستم وارد الگوریتم شده و به طور خودکار نتایج را بهروز میکند و اگر سیستم دارای قابلیت تصمیمگیری خودکار باشد، براساس نتایج تصمیمات جدیدی را اتخاذ میکند.
معماری و طراحی این سیستمها نیاز به تکنیک و پیچیدگی بیشتر دارد و چالشهای متفاوتی نسبت سیستمهای Batch یا پردازش دست جمعی دارد.
شاخه های بسیاری را میتوان در کاربرد علم داده نام برد. از جمله:
- نظامی: بهینه کردن محل برخورد موشک، تشخیص حملات سایبری و غیره
- تولید محتوا
- بررسی وقایع اجتماعی
- راهاندازی کمپین انتخاباتی و تبلیغاتی
- قانونگذاری خرد و کلان
- پیشبینی تاثیر قوانین وضع شده در حوزهی مالی، اجتماعی و غیره
اما در آخر باید در نظر داشت که تمامی توانمدی دانشمند علم داده بر اساس دادهها موجود است. متاسفانه یکی از آفات بزرگ فعلی برای اجرای پروژه های موفق علم دادهای، عدم ثبت وقایع و موضوعات ارزشمند است. این موارد باید توسط دانشمندان علوم داده در اسرع وقت شناسایی شده و به کارفرما یا تیم تولید کننده نرم افزار گزارش شود. اما این نکته نباید ذات کنجکاوانه و تحلیلی ما را تحت تاثیر قرار دهد. چرا که در بسیاری از مواقع دادههایی که مورد نیاز هستند اما ثبت نشدهاند و یا به هر دلیل در دسترس نیستند، از طریق دادههای موجود دیگر قابل احصا هستند.
دانلود این مقاله
5 دیدگاه
Amin
سلام
خیلی متن خوبی بود
فقط اگر به حوزه های سلامت و روانشناسی، و همچنین حوزه های دیگری که علم داده در آنها کاربرد دارد اشاره میکردید بهتر هم میشد
با تشکر
نگار میردریکوند
سلام
در حوزه سلامت می توان به انواع تشخیص های بیماری ها از جمله تشخیص سرطان ریه با استفاده از تصاویر سی تی اسکن، تشخیص خرابی دندان با استفاده از عکس opg، تشخیص دیابت و بیماری قلب؛ در حوزه بیماری اوتیسم و همچنین در حوزه سلامت روان اشاره نمود..
mahdi
سلام اگر میشه در مورد کاربرد دیتا ساینس در صنعت هم توضیح بدید
نگار میردریکوند
به طور خلاصه میتوان در صنعت خودرو سازی به تنظیم مناسب صندلی جهت نشستن راننده ؛تشخیص پلاک خودرو .
پیش بینی میزان فروش و تحلیل رفتار مشتریان و شناسایی تقلب و پولشویی،
حسین
سلام
اگه لطف کنید و در مورد کاربرد علم داده در تحلیل وقایع اجتماعی توضیح بدید ممنون میشم
مسعود
سلام بابت مطالب کاربردی و مفیدتان سپاسگزارم