چگونه فرصت های استفاده از یادگیری ماشین در کسب و کارمان را پیدا کنیم؟

مختصری درباره هوش مصنوعی و یادگیری ماشینی

هوش مصنوعی دیگر زیرمجموعه انحصاری رشته‌ی علوم کامپیوتری به شمار نمی رود. غول‌های فناوری سالهاست که در کسب و کار خود از AI استفاده می کنند: توصیه محصولات به مشتریان در سایت‌های فروش آنلاین، نقشه‌های گوگل و مطالب و تبلیغات سفارشی شده‌ای که فیس‌بوک، اینستاگرام و توییتر در رسانه‌ها به اشتراک می گذارند. واقعیت این است که آینده در دستان امروز است! اما دانش اینکه چگونه می توان به آن دست پیدا کرد، در اختیار همه قرار ندارد.

شرکت ها در شروع کار با یادگیری ماشین Machine Learning (زیرمجموعه ای از هوش مصنوعی)، با چالش‌های فراوانی مانند کمبود نیروی تحلیلگر داده مواجه هستند؛ اما مهم تر از آن تعداد بسیار کم مدیران و کارکنانی است که توانایی رصد فرصت های مبتنی بر هوش مصنوعی را داشته باشند. لازم به ذکر است در یافتن این فرصت ها نیازی به داشتن مدرک دکترای آمار و یا حتی توانایی کدنویسی، وجود ندارد.

دانستن ساز و کار کلی الگوریتم های یادگیری ماشین به یکی از مهم ترین مهارت های کسب و کار تبدیل شده است. متخصصان یادگیری ماشین نمی توانند به تنهایی کار کنند، بلکه باید در قالب کار تیمی با خبره های حوزه های کسب و کار برای تعریف دقیق مشکلات کسب و کارها، انتخاب داده‌های مناسب برای حل مسائل، گرفتن بازخوردهای خروجی و تعیین شاخص های موفقیت همکاری داشته باشند.

اما فرآیند یادگیری ماشین به چه صورت است؟ بیایید سفری کوتاه به ریاضی دوره دبیرستان داشته باشیم، قول می دهم بسیار سریع تمام شود! زمانی که برای اولین بار یاد گرفتیم معادله خط راست بصورت y = mx + b. و معادلات جبری این چنینی نشان دهنده رابطه بین دو متغیر x و y است. در درس جبر، مقدار m و b داده می شد و سپس با دادن مقادیر ورودی به x می توانستیم نقاط متناظر y آن را محاسبه کنیم. در واقع مسأله با معادله شروع می شد و سپس نقاطی را در صفحه به دست می آوردیم.

یکی از انواع یادگیری ماشین به نام "یادگیری تحت نظارت" این فرآیند را برعکس انجام می دهد، یعنی به عبارتی مختصات نقاط در صفحه وجود دارد و باید به معادله خطی برسیم (محاسبه شیب خط (m) و b.) که بیشتر پاسخ ها و اطلاعات روی آن خط موجود باشند. "یادگیری" به این معنی است که ماشین می تواند این معادله را  با هر تجربه، دقیق تر و به روز نماید. معادله بدست آمده از این روش تقریبا هیچ وقت رابطه بین x و y را با دقت 100٪ مشخص نمی کند، اما برای تعمیم دادن به ورودی های جدید ابزاری بسیار قدرتمند است. هنگامی که شیب قابل اطمینان و متناسب با داده‌های موجود یافت شد، اگر یک مقدار x جدید را وارد کنیم، می توانیم یک حدس پخته و دقیق برای مقدار متناظر y دریافت کنیم.

پیش بینی عددی

البته همانطور که احتمالا خودتان ممکن است به این موضوع فکر کرده باشید، خیلی از مسایل جذاب یادگیری ماشینی با معادله خطی ساده حل شدنی نیستند. ساز و کار الگوریتم های تحت نظارت یادگیری ماشینی به این صورت است که مقادیر x و y گذشته را در دست داریم و قرار است y های آینده را متناظر با xهای جدید پیش بینی کنیم؛ این ایده ما را به سوی یکی از ساده ترین شکل های یادگیری با نظارت به نام "رگرسیون خطی یا پیش بینی عددی" هدایت می کند.

به عنوان مثالی برای رگرسیون خطی، فرض کنید یک دانشمند داده مسأله پیش بینی قیمت املاک و مستغلات را برای منطقه ای در دست دارد. پس از تجزیه و تحلیل داده ها، مشخص می شود که قیمت مسکن (y) با اندازه خانه (x) رابطه ای نزدیک دارد. بنابراین، او از از داده های اندازه و قیمت خانه ها استفاده می کند، از نمودار بدست آمده و معادله y = mx + b برای پیش بینی قیمت یک خانه معین با داشتن مساحت آن، استفاده می کند. این یک کاربرد ساده رگرسیون خطی است، و در حالت پیچیده تر همین مسأله به ویژگی هایی چون داشتن پارکینگ، تعداد اتاق ها، کفپوش خانه، سیستم تهویه و ... موارد این چنینی برای تخمین خیلی دقیق تر توجه می شود.

بنابراین پرسش ما درباره اینکه چگونه شروع به شناسایی فرصت های هوش مصنوعی کنیم از اینجا شروع می شود:

نتایج پیش بینی ها چه ارزشی دارد؟ و آیا داده های لازم برای انجام فرآیند یادگیری تحت نظارت را در دست داریم؟
سازمان ها از تکنیک های مشابه برای پیش بینی فروش آینده محصولات، ریسک سرمایه گذاری و یا از دست دادن مشتری استفاده می کنند. در بعضی از تکنیک ها، خروجی پیش بینی، ساده مانند یک عدد است. و اما در برخی تکنیک های دیگر خروجی پیش بینی به صورت چندجوابی با محاسبه درصد احتمال پیشامد هر حالت است.

طبقه بندی

صحبت تا به اینجا، درباره مسائلی از نوع پیش بینی بود، اما یادگیری تحت نظارت برای "طبقه بندی" نیز استفاده می شود.

در الگوریتم های نوع طبقه بندی، داده ها با توجه به ویژگی های مشترک موجود به چند دسته تقسیم می شوند. دانشمند داده به دنبال ویژگی های قابل اطمینان در مجموعه داده می گردد که بتواند بر مبنای آن، این جدا سازی را انجام دهد: اگر داده دارای ویژگی x باشد، به دسته اول می رود؛ در غیر اینصورت، به دسته دوم منتقل می شود.

سازمانها از الگوریتم های طبقه بندی برای فیلتر کردن هرزنامه ها، تشخیص موارد غیرنرمال در عکسبرداری های پزشکی، تشخیص اسناد مرتبط برای پرونده های حقوقی، مرتب کردن و تحلیل رزومه های کاری یا بخش بندی مشتریان استفاده می کنند. اما طبقه بندی، قدرت واقعی خود را هنگامی که تعداد کلاس ها افزایش می یابد و تحلیل آن خارج از توان و ظرفیت محدود افراد است، نشان می دهد. در طبقه بندی می توان به هر دسته برچسب مناسبی که طبق آن عملیات جداسازی صورت می گیرد اختصاص داد: از خروجی بله/ خیر گرفته تا به عنوان مثال، نام گونه های مختلف حیوانات به عنوان برچسب هر دسته، که با اضافه کردن هر ورودی جدید، ماشین تشخیص می دهد این ورودی باید به کدام دسته و برچسب تعلق بگیرد.

از یادگیری ماشینی در کار استفاده کنیم!

حال، چطور می توانیم ساختارهای این چنینی را در کار روزمره خود پیدا کنیم و از الگوریتم های یادگیری ماشین برای ساده کردن کارهای خود استفاده کنیم؟
در این قسمت چندین راه که بتوان تعیین کرد در کارهایی که انجام می دهیم فرصت استفاده از یادگیری ماشینی تحت نظارت وجود دارد یا خیر، معرفی می کنیم:

اول، آنچه را که در کار خود انجام می دهید بنویسید. فعالیت های خود را به موارد زیر تقسیم کنید:

1 - کارهایی که روزانه و بصورت روتین انجام می دهید در مقابل کارهایی که گهگاه انجام می دهید؛
2 - کارهایی که به سادگی انجام می دهید در مقابل کارهایی که برای انجام آن‌ها نیاز به تفکر زیاد یا مشورت با دیگران دارید.
3 - کارهایی که بخشی از یک فرآیند محسوب می شوند در مقابل کارهایی که به صورت مستقل انجام می دهید.

برای آن دسته از وظایفی که به تنهایی و به صورت روتین انجام می دهید، شناسایی کنید چند نفر دیگر در سازمان شما همان کارهای مشابه را انجام داده یا می دهند.

ماهیت کار را بررسی کنید. آیا شرایطی وجود دارد که بتوانید از الگوریتم های پیش بینی یا طبقه بندی استفاده کنید؟
از خودتان بپرسید: اگر ده تن از همکاران شما این کار را انجام می دادند، آیا همه آنها بر نتیجه توافق داشتند؟ اگر انسان ها نتواند بر سر درست یا نادرست بودن چیزی به توافق برساند، کامپیوترها نیز نمی توانند تصمیم گیری قابل اطمینان ارائه دهند.

چه مدت است که در سازمان شما این کار انجام می شود؟ اگر مدت زیادی است، آیا سوابقی از انجام موفقیت آمیز این کار وجود دارد؟ اگر پاسخ مثبت است، از این سوابق می توان به عنوان مجموعه داده آموزشی برای الگوریتم یادگیری تحت نظارت استفاده کرد. اگر پاسخ منفی است، باید از امروز این داده ها را جمع آوری کنید تا بتوانید در آینده از یادگیری الگوهای داده ها توسط ماشین استفاده کنید.

در مرحله بعدی، با یک تیم علوم داده درباره فرایند کار و جنبه هایی که می خواهید بر آنها تمرکز کنید، صحبت کنید. این به آنها کمک خواهد کرد که تشخیص بدهند آیا استفاده از الگوریتم های یادگیری ماشین در کار شما میسر و  قابل اجرا است یا خیر. و سپس به شما در تشخیص ویژگی هایی از داده ها که به خروجی مطلوب منجر می شود، کمک می کنند.

از خودتان بپرسید، اگر این فرآیند انجام شود، چه تغییراتی در محصولات یا خدمات ارائه شده به مشتری ایجاد خواهد شد؟ بدترین اتفاقی که می تواند برای کسب و کار رخ دهد چه خواهد بود؟ و نهایتا بپرسید، بدترین اتفاقی که می تواند رخ دهد ، در زمانی که الگوریتم پاسخ اشتباه یا پاسخ با سطح دقت 65 یا 70 درصد ایجاد کند چه خواهد بود؟ حداقل سطح دقتی که کسب و کار شما نیازمند آن است تا فرایند پیش بینی یا طبقه بندی اتوماتیک نسبتا مطلوبی انجام شود، چقدر است ؟

موفقیت در استفاده از یادگیری تحت نظارت مستلزم تغییر در دیدگاه در مورد چگونگی نحوه انجام کار است. باید از داده های کارهای انجام شده در گذشته - نظرات متخصصین حوزه های کسب و کار- برای ایجاد یک الگوریتم مناسب در پیش بینی آینده استقاده شود. هنگامی که این فرایند به خوبی اجرا شود، باعث می شود کارکنان نیز کارآمد تر باشند و ارزش های جدیدی ایجاد کنند. این مهم با شناسایی مشکلاتی که ارزش حل کردن و فکر کردن دارند در قالب ورودی و خروجی های متناظر شروع می شود.

منبع: HBR

نظرات

ثبت ایمیل در خبر نامه

اگر از این مقاله خوشتان آمده ایمیل خود را وارد کنید تا مقالات مشابه را برایتان بفرستیم!