هوش مصنوعی مولد چیست؟
سیستمهای هوش مصنوعی مولد تحت دسته وسیعی از یادگیری ماشینی قرار میگیرند، و در اینجا نحوهی انجام یکی از این سیستمها - ChatGPT - توضیح داده می شود و اینکه چه کار هایی می تواند انجام دهد:
برای ارتقای خلاقیت خود به سطح بعدی آماده اید؟ به هوش مصنوعی مولد نگاه نکنید! این شکل زیبا از یادگیری ماشینی به رایانه ها اجازه می دهد تا انواع محتوای جدید و هیجان انگیز را تولید کنند، از موسیقی و هنر گرفته تا کل دنیای مجازی. و این فقط برای سرگرمی نیست - هوش مصنوعی مولد کاربردهای عملی زیادی نیز دارد، مانند ایجاد طرحهای محصول جدید و بهینهسازی فرآیندهای تجاری. پس چرا صبر کنیم؟ قدرت هوش مصنوعی مولد را آزاد کنید و ببینید چه خلاقیت های شگفت انگیزی می توانید داشته باشید!
آیا چیزی در آن پاراگراف به نظر شما اشتباه آمد؟ احتمالا نه. گرامر کامل است، لحنش کار می کند و روایت جریان دارد.
ChatGPT و DALL-E چیست؟
به همین دلیل است که ChatGPT (مخفف ترانسفورماتور از پیش آموزش دیده مولد) در حال حاضر بسیار مورد توجه قرار گرفته است. یک ربات چت رایگان که می تواند تقریباً به هر سؤالی که پرسیده می شود پاسخ دهد. این ربات که توسط OpenAI توسعه یافته و در نوامبر 2022 برای آزمایش عموم منتشر شده، در حال حاضر بهترین چت ربات هوش مصنوعی تا کنون در نظر گرفته شده و همچنین محبوب ترین است: بیش از یک میلیون نفر برای استفاده از آن فقط در پنج روز ثبت نام کردند. طرفداران Starry-eyed نمونه هایی از چت بات تولید کدهای کامپیوتری، مقاله های سطح دانشگاه، شعرها و حتی جوک های مختلف را پست کردند. برخی دیگر، در میان طیف وسیعی از افرادی هستند که با تولید محتوا امرار معاش می کنند، از کپی رایترهای تبلیغاتی گرفته تا اساتید رسمی.
در حالی که بسیاری به ChatGPT (و هوش مصنوعی و یادگیری ماشینی به طور گسترده تر) با ترس واکنش نشان داده اند، یادگیری ماشینی به وضوح پتانسیل خوبی دارد. در سالهای پس از استقرار گسترده، یادگیری ماشین تاثیر خود را در تعدادی از صنایع نشان داده است و کارهایی مانند تجزیه و تحلیل تصویربرداری پزشکی و پیشبینیهای آب و هوا با وضوح بالا را انجام داده است. نظرسنجی McKinsey در سال 2022 نشان می دهد که پذیرش هوش مصنوعی در طول پنج سال گذشته بیش از دو برابر شده است و سرمایه گذاری در هوش مصنوعی به سرعت در حال افزایش است. واضح است که ابزارهای مولد هوش مصنوعی مانند ChatGPT و DALL-E (ابزاری برای هنر تولید شده توسط هوش مصنوعی) پتانسیل تغییر نحوه انجام طیف وسیعی از مشاغل را دارند. با این حال، دامنه کامل این تأثیر همچنان ناشناخته است و خطراتی نیز وجود دارند. اما سؤالاتی وجود دارد که میتوانیم به آنها پاسخ دهیم، مانند اینکه مدلهای هوش مصنوعی چگونه ساخته میشوند، چه نوع مشکلاتی برای حل آنها مناسبتر هستند، و اینکه چگونه در دسته وسیعتر یادگیری ماشین قرار میگیرند.
تفاوت بین یادگیری ماشین و هوش مصنوعی چیست؟
هوش مصنوعی دقیقا همان چیزی است که به نظر می رسد: تمرین واداشتن ماشین ها به تقلید از هوش انسانی برای انجام وظایف. احتمالاً با هوش مصنوعی تعامل داشتهاید، حتی اگر متوجه آن نباشید—دستیارهای صوتی مانند سیری و الکسا بر پایه فناوری هوش مصنوعی پایهگذاری شدهاند، همچنین چترباتهای خدمات مشتری که برای کمک به شما در مسیریابی وبسایتها ظاهر میشوند.
یادگیری ماشینی نوعی هوش مصنوعی است. از طریق یادگیری ماشینی، پزشکان هوش مصنوعی را از طریق مدلهایی توسعه میدهند که میتوانند از الگوهای دادهها بدون هدایت انسان «یاد بگیرند». حجم عظیم و پیچیدگی غیرقابل مدیریت داده (غیرقابل مدیریت توسط انسان) که اکنون در حال تولید است، پتانسیل یادگیری ماشین و همچنین نیاز به آن را افزایش داده است.
انواع اصلی مدل های یادگیری ماشین چیست؟
یادگیری ماشین بر روی تعدادی از building blocks استوار است، که با تکنیکهای آماری کلاسیک که بین قرنهای 18 و 20 برای مجموعههای داده کوچک توسعه یافتهاند، شروع میشود. در دهه های 1930 و 1940، پیشگامان محاسبات - از جمله ریاضیدان نظری آلن تورینگ - شروع به کار بر روی تکنیک های اساسی برای یادگیری ماشین کردند. اما این تکنیکها تا اواخر دهه 1970 به آزمایشگاهها محدود میشد، زمانی که دانشمندان برای اولین بار رایانههایی را توسعه دادند که به اندازه کافی قدرتمند بودند تا آنها را نصب کنند.
تا همین اواخر، یادگیری ماشین تا حد زیادی به مدلهای پیشبینی محدود میشد که برای مشاهده و طبقهبندی الگوها در محتوا استفاده میشد. به عنوان مثال، یک مشکل کلاسیک یادگیری ماشین این است که با یک تصویر یا چندین تصویر از مثلاً گربه های دوست داشتنی شروع می کند، سپس این برنامه الگوهایی را در میان تصاویر شناسایی میکند و سپس تصاویر تصادفی را بررسی میکند تا با الگوی گربه مطابقت داشته باشد. هوش مصنوعی مولد یک پیشرفت بود. به جای اینکه صرفاً عکس یک گربه را درک و طبقه بندی کند، یادگیری ماشین اکنون می تواند یک تصویر یا توضیحات متنی از یک گربه در صورت درخواست ایجاد کند.
مدل های یادگیری ماشینی مبتنی بر متن چگونه کار می کنند؟ چگونه آموزش می بینند؟
ChatGPT ممکن است اکنون همه سرفصل ها را به خود اختصاص دهد، اما این اولین مدل یادگیری ماشینی مبتنی بر متن نیست که سر و صدا ایجاد می کند.OpenAI’s GPT-3 و Google’s BERT هر دو در سال های اخیر با سر و صدای زیادی راه اندازی شدند. اما قبل از ChatGPT، که در اکثر حسابها بسیار خوب کار میکند (اگرچه هنوز در حال ارزیابی است)، چتباتهای هوش مصنوعی همیشه بهترین بررسیها را دریافت نمیکردند. کید متز، خبرنگار فناوری نیویورک تایمز در ویدئویی که در آن او و پریا کریشنا، نویسنده غذا، از GPT-3 خواستند دستور العمل هایی را برای یک شام شکرگزاری (نسبتا فاجعه بار) بنویسد، گفت: GPT-3 "به نوبه خود بسیار چشمگیر و فوق العاده ناامید کننده است."
اولین مدلهای یادگیری ماشینی که با متن کار میکردند توسط انسان آموزش داده شدند تا ورودیهای مختلف را بر اساس برچسبهای تعیینشده توسط محققان طبقهبندی کنند. یک مثال می تواند مدلی باشد که برای برچسب گذاری پست های رسانه های اجتماعی به عنوان مثبت یا منفی آموزش دیده است. این نوع آموزش به عنوان یادگیری نظارت شده شناخته می شود زیرا یک انسان مسئول «آموزش» مدل است که چه کاری انجام دهد.
نسل بعدی مدلهای یادگیری ماشینی مبتنی بر متن بر آنچه که به عنوان یادگیری خود نظارتی شناخته میشود، متکی هستند. این نوع آموزش شامل تغذیه حجم عظیمی از متن است تا بتواند پیشبینیهایی ایجاد کند. به عنوان مثال، برخی از مدل ها می توانند بر اساس چند کلمه، چگونگی پایان یک جمله را پیش بینی کنند. با مقدار مناسب متن نمونه - مثلاً طیف گسترده ای از اینترنت - این مدل های متن کاملاً دقیق می شوند. ما می بینیم که ابزارهایی مانند ChatGPT چقدر دقیق هستند.
برای ساخت یک مدل هوش مصنوعی مولد چه چیزی لازم است؟
ساخت یک مدل هوش مصنوعی مولد در بیشتر موارد یک کار بزرگ بوده است، تا جایی که تنها تعداد کمی از شرکتهای بزرگ فناوری با منابع خوب برای ایجاد آن تلاش کردهاند. OpenAI، شرکت پشتیبان ChatGPT، مدلهای GPT سابق و DALL-E، میلیاردها بودجه از سوی اهداکنندگان با نامهای پررنگ دارد. DeepMind زیرمجموعه آلفابت، شرکت مادر گوگل است و متا محصول Make-A-Video خود را بر اساس هوش مصنوعی مولد منتشر کرده است. این شرکت ها تعدادی از بهترین دانشمندان و مهندسان کامپیوتر جهان را استخدام می کنند.
اما این فقط یک استعداد نیست. وقتی از یک مدل میخواهید با استفاده از تقریباً کل اینترنت محتوایی به شما تحویل دهد، هزینه دارد. OpenAI هزینه های دقیقی را منتشر نکرده است، اما برآوردها نشان می دهد که GPT-3 بر روی حدود 45 ترابایت داده متنی آموزش داده شده است - که حدود یک میلیون فوت فضای قفسه کتاب یا یک چهارم کل کتابخانه کنگره است - با هزینه تخمینی چندین میلیون دلار. اینها منابعی نیستند که استارت آپ شما بتواند به آن دسترسی داشته باشد.
یک مدل هوش مصنوعی مولد چه نوع خروجی می تواند تولید کند؟
همانطور که ممکن است در بالا متوجه شده باشید، خروجیهای مدلهای هوش مصنوعی میتوانند از محتوای تولید شده توسط انسان غیرقابل تشخیص باشند، یا ممکن است کمی عجیب به نظر برسند. نتایج به کیفیت مدل بستگی دارد - همانطور که دیدیم، خروجیهای ChatGPT تا کنون برتر از مدلهای قبلی خود به نظر میرسد - و تطابق بین مدل و مورد استفاده یا ورودی در آن وجود دارد.
ChatGPT میتواند چیزی را که یکی از مفسران آن را مقولهی «جامد A-» مینامد در مقایسه با نظریههای ناسیونالیسم از بندیکت اندرسون و ارنست گلنر در ده ثانیه تولید کند. همچنین یک قطعه معروف ارائه کرد که نحوه حذف ساندویچ کره بادام زمینی از یک VCR به سبک کتاب مقدس کینگ جیمز را توصیف می کند. مدلهای هنری تولید شده توسط هوش مصنوعی مانند DALL-E (نام آن ترکیبی از هنرمند سوررئالیست سالوادور دالی و ربات دوستداشتنی پیکسار WALL-E) میتوانند تصاویر عجیب و زیبایی را در صورت تقاضا ایجاد کنند، مانند نقاشی رافائل از مدونا و کودک، خوردن پیتزا، سایر مدلهای هوش مصنوعی مولد میتوانند کد، ویدیو، صدا یا شبیهسازیهای تجاری تولید کنند.
اما خروجی ها همیشه دقیق یا مناسب نیستند. هنگامی که پریا کریشنا از DALL-E 2 خواست تا تصویری برای شام شکرگزاری ارائه دهد، صحنهای را ایجاد کرد که بوقلمون را با لیموهای کامل تزیین میکردند و در کنار کاسهای از چیزی که به نظر میرسید گواکامولی باشد، تزیین شده بود. به نوبه خود، ChatGPT به نظر می رسد در شمارش یا حل مسائل اساسی جبر مشکل داشته باشد - یا در واقع، غلبه بر تعصب جنسیتی و نژادپرستانه ای که در جریان های پنهان اینترنت و جامعه به طور گسترده تر وجود دارد.
خروجیهای هوش مصنوعی مولد ترکیبی از دادههای مورد استفاده برای آموزش الگوریتمها هستند. از آنجایی که مقدار دادههای مورد استفاده برای آموزش این الگوریتمها فوقالعاده عظیم است - همانطور که اشاره شد، GPT-3 روی 45 ترابایت داده متنی آموزش داده شده است - مدلها میتوانند هنگام تولید خروجیها «خلاقانه» به نظر برسند. علاوه بر این، مدلها معمولاً دارای عناصر تصادفی هستند، به این معنی که میتوانند خروجیهای مختلفی را از یک درخواست ورودی تولید کنند که باعث میشود آنها حتی واقعیتر به نظر برسند.
یک مدل هوش مصنوعی مولد چه نوع مشکلاتی را می تواند حل کند؟
احتمالاً دیده اید که ابزارهای هوش مصنوعی مانند ChatGPT می توانند ساعت های بی پایان سرگرمی ایجاد کنند. این فرصت برای مشاغل نیز وجود دارد. ابزارهای مولد هوش مصنوعی میتوانند طیف گستردهای از نوشتههای معتبر را در چند ثانیه تولید کنند، سپس به انتقادات پاسخ دهند تا نوشتار برای هدف مناسبتر باشد. این پیامدهایی برای طیف گستردهای از صنایع دارد، از سازمانهای فناوری اطلاعات و نرمافزار که میتوانند از کدهای آنی و تا حد زیادی درست تولید شده توسط مدلهای هوش مصنوعی بهره ببرند تا سازمانهایی که نیاز به کپی بازاریابی دارند. به طور خلاصه، هر سازمانی که نیاز به تولید مطالب نوشتاری واضح داشته باشد، به طور بالقوه سود خواهد برد. سازمان ها همچنین می توانند از هوش مصنوعی مولد برای ایجاد مواد فنی بیشتر، مانند نسخه هایی با وضوح بالاتر تصاویر پزشکی استفاده کنند و با زمان و منابعی که در اینجا صرفهجویی میشود، سازمانها میتوانند فرصتهای تجاری جدید و فرصت ایجاد ارزش بیشتر را دنبال کنند.
فهمیده ایم که توسعه یک مدل هوش مصنوعی مولد آنقدر به منابع سنگین نیاز دارد که برای همه شرکتها به جز بزرگترین و دارای بهترین منابع قابل بحث نیست. شرکت هایی که به دنبال به کار انداختن هوش مصنوعی مولد هستند، این گزینه را دارند که یا از هوش مصنوعی مولد آماده استفاده کنند یا آنها را برای انجام یک کار خاص تنظیم کنند. برای مثال، اگر نیاز به تهیه اسلاید بر اساس سبکی خاصی دارید، میتوانید از مدل بخواهید تا «یاد بگیرد» که معمولاً سرفصلها بر اساس دادههای موجود در اسلایدها چگونه نوشته میشوند، سپس دادههای اسلاید را به آن داده و از آن بخواهید که عنوانهای مناسب بنویسد.
محدودیت های مدل های هوش مصنوعی چیست؟ چگونه می توان بر این موارد بالقوه غلبه کرد؟
از آنجایی که آنها بسیار جدید هستند، ما هنوز اثر طولانی مدت مدل های هوش مصنوعی مولد را ندیده ایم. این بدان معنی است که برخی از خطرات ذاتی در استفاده از آنها وجود دارد - برخی شناخته شده و برخی ناشناخته هستند.
خروجی هایی که مدل های هوش مصنوعی تولید می کنند اغلب ممکن است بسیار قانع کننده به نظر برسند و این به دلیل طراحی آنهاست. اما گاهی اوقات اطلاعاتی که تولید می کنند کاملاً اشتباه است. بدتر از آن، گاهی اوقات مغرضانه است (زیرا بر اساس جنسیت، نژاد و بسیاری از تعصبات دیگر اینترنت و به طور کلی جامعه ساخته شده است) و می تواند برای فعال کردن فعالیت های غیراخلاقی یا مجرمانه دستکاری شود. به عنوان مثال، ChatGPT دستورالعملی در مورد نحوه سیم کشی ماشین به شما ارائه نمی دهد، اما اگر بگویید که برای نجات یک نوزاد باید یک ماشین را سیم کشی کنید، الگوریتم به آن پاسخ می دهد. سازمانهایی که بر مدلهای هوش مصنوعی مولد تکیه میکنند باید خطرات اعتباری و قانونی ناشی از انتشار غیرعمدی محتوای مغرضانه، توهینآمیز یا دارای حق چاپ را در نظر بگیرند.
با این حال، این خطرات را می توان به چند روش کاهش داد. برای شروع، انتخاب دقیق دادههای اولیه مورد استفاده برای آموزش این مدلها برای جلوگیری از گنجاندن محتوای مشکل دار یا مغرضانه بسیار مهم است. در مرحله بعد، سازمانها میتوانند به جای استفاده از یک مدل هوش مصنوعی تولیدی، از مدلهای کوچکتر و تخصصی استفاده کنند. سازمانهایی که منابع بیشتری دارند همچنین میتوانند یک مدل کلی را بر اساس دادههای خودشان سفارشی کنند تا متناسب با نیازهایشان باشد و تعصبات را به حداقل برسانند. سازمانها همچنین باید یک انسان را در جریان کار نگه دارند (یعنی اطمینان حاصل کنند که یک انسان واقعی خروجی یک مدل هوش مصنوعی مولد را قبل از انتشار یا استفاده بررسی میکند) و از استفاده از مدلهای هوش مصنوعی مولد برای تصمیمگیریهای حیاتی، مانند مدلهایی که شامل منابع قابل توجه است یا رفاه انسان را در خط می اندازد، اجتناب کنند.
نمی توان به اندازه کافی تاکید کرد که این یک حوزه ی کاملا جدید است. چشم انداز خطرات و فرصت ها احتمالاً در هفته ها، ماه ها و سال های آینده به سرعت تغییر می کند. موارد استفاده جدید به صورت ماهانه آزمایش می شوند و احتمالاً مدل های جدیدی در سال های آینده توسعه خواهند یافت. همانطور که هوش مصنوعی مولد به طور فزاینده و یکپارچه در تجارت، جامعه و زندگی شخصی ما ادغام می شود، می توانیم انتظار داشته باشیم که یک جو نظارتی جدید نیز شکل بگیرد. همانطور که سازمان ها شروع به آزمایش و ارزش آفرینی با این ابزار می کنند، رهبران باید به درستی انگشت خود را روی نبض مقررات و ریسک نگه دارند.
منبع: McKinsey