تنها 2 مقاله دیگر را می‌توانی رایگان مطالعه کنی. ثبت نام کن تا مقاله‌های بیشتری بخوانی.

هوش مصنوعی مولد چیست؟

هوش مصنوعی مولد (AI) الگوریتم‌هایی (مانند ChatGPT) را توصیف می‌کند که می‌توان از آنها برای ایجاد محتوای جدید، از جمله صدا، کد، تصاویر، متن، شبیه‌سازی و ویدئو استفاده کرد. پیشرفت‌های اخیر در این زمینه این پتانسیل را دارد که روش ما را برای تولید محتوا به شدت تغییر دهد.

حمیدرضا عمادی

دنبال کنید

۳۰ اردیبهشت • در 10 دقیقه بخوانید

سیستم‌های هوش مصنوعی مولد تحت دسته وسیعی از یادگیری ماشینی قرار می‌گیرند، و در اینجا نحوه‌ی انجام یکی از این سیستم‌ها - ChatGPT - توضیح داده می شود و اینکه چه کار هایی می تواند انجام دهد:

برای ارتقای خلاقیت خود به سطح بعدی آماده اید؟ به هوش مصنوعی مولد نگاه نکنید! این شکل زیبا از یادگیری ماشینی به رایانه ها اجازه می دهد تا انواع محتوای جدید و هیجان انگیز را تولید کنند، از موسیقی و هنر گرفته تا کل دنیای مجازی. و این فقط برای سرگرمی نیست - هوش مصنوعی مولد کاربردهای عملی زیادی نیز دارد، مانند ایجاد طرح‌های محصول جدید و بهینه‌سازی فرآیندهای تجاری. پس چرا صبر کنیم؟ قدرت هوش مصنوعی مولد را آزاد کنید و ببینید چه خلاقیت های شگفت انگیزی می توانید داشته باشید!

آیا چیزی در آن پاراگراف به نظر شما اشتباه آمد؟ احتمالا نه. گرامر کامل است، لحنش کار می کند و روایت جریان دارد.

ChatGPT و DALL-E چیست؟

به همین دلیل است که ChatGPT (مخفف ترانسفورماتور از پیش آموزش دیده مولد) در حال حاضر بسیار مورد توجه قرار گرفته است. یک ربات چت رایگان که می تواند تقریباً به هر سؤالی که پرسیده می شود پاسخ دهد. این ربات که توسط OpenAI توسعه یافته و در نوامبر 2022 برای آزمایش عموم منتشر شده، در حال حاضر بهترین چت ربات هوش مصنوعی تا کنون در نظر گرفته شده و همچنین محبوب ترین است: بیش از یک میلیون نفر برای استفاده از آن فقط در پنج روز ثبت نام کردند. طرفداران Starry-eyed نمونه هایی از چت بات تولید کدهای کامپیوتری، مقاله های سطح دانشگاه، شعرها و حتی جوک های مختلف را پست کردند. برخی دیگر، در میان طیف وسیعی از افرادی هستند که با تولید محتوا امرار معاش می کنند، از کپی رایترهای تبلیغاتی گرفته تا اساتید رسمی.

در حالی که بسیاری به ChatGPT (و هوش مصنوعی و یادگیری ماشینی به طور گسترده تر) با ترس واکنش نشان داده اند، یادگیری ماشینی به وضوح پتانسیل خوبی دارد. در سال‌های پس از استقرار گسترده، یادگیری ماشین تاثیر خود را در تعدادی از صنایع نشان داده است و کارهایی مانند تجزیه و تحلیل تصویربرداری پزشکی و پیش‌بینی‌های آب و هوا با وضوح بالا را انجام داده است. نظرسنجی McKinsey در سال 2022 نشان می دهد که پذیرش هوش مصنوعی در طول پنج سال گذشته بیش از دو برابر شده است و سرمایه گذاری در هوش مصنوعی به سرعت در حال افزایش است. واضح است که ابزارهای مولد هوش مصنوعی مانند ChatGPT و DALL-E (ابزاری برای هنر تولید شده توسط هوش مصنوعی) پتانسیل تغییر نحوه انجام طیف وسیعی از مشاغل را دارند. با این حال، دامنه کامل این تأثیر همچنان ناشناخته است و خطراتی نیز وجود دارند. اما سؤالاتی وجود دارد که می‌توانیم به آنها پاسخ دهیم، مانند اینکه مدل‌های هوش مصنوعی چگونه ساخته می‌شوند، چه نوع مشکلاتی برای حل آنها مناسب‌تر هستند، و اینکه چگونه در دسته وسیع‌تر یادگیری ماشین قرار می‌گیرند.

تفاوت بین یادگیری ماشین و هوش مصنوعی چیست؟

هوش مصنوعی دقیقا همان چیزی است که به نظر می رسد: تمرین واداشتن ماشین ها به تقلید از هوش انسانی برای انجام وظایف. احتمالاً با هوش مصنوعی تعامل داشته‌اید، حتی اگر متوجه آن نباشید—دستیارهای صوتی مانند سیری و الکسا بر پایه فناوری هوش مصنوعی پایه‌گذاری شده‌اند، همچنین چت‌ربات‌های خدمات مشتری که برای کمک به شما در مسیریابی وب‌سایت‌ها ظاهر می‌شوند.

یادگیری ماشینی نوعی هوش مصنوعی است. از طریق یادگیری ماشینی، پزشکان هوش مصنوعی را از طریق مدل‌هایی توسعه می‌دهند که می‌توانند از الگوهای داده‌ها بدون هدایت انسان «یاد بگیرند». حجم عظیم و پیچیدگی غیرقابل مدیریت داده (غیرقابل مدیریت توسط انسان) که اکنون در حال تولید است، پتانسیل یادگیری ماشین و همچنین نیاز به آن را افزایش داده است.

انواع اصلی مدل های یادگیری ماشین چیست؟

یادگیری ماشین بر روی تعدادی از building blocks استوار است، که با تکنیک‌های آماری کلاسیک که بین قرن‌های 18 و 20 برای مجموعه‌های داده کوچک توسعه یافته‌اند، شروع می‌شود. در دهه های 1930 و 1940، پیشگامان محاسبات - از جمله ریاضیدان نظری آلن تورینگ - شروع به کار بر روی تکنیک های اساسی برای یادگیری ماشین کردند. اما این تکنیک‌ها تا اواخر دهه 1970 به آزمایشگاه‌ها محدود می‌شد، زمانی که دانشمندان برای اولین بار رایانه‌هایی را توسعه دادند که به اندازه کافی قدرتمند بودند تا آنها را نصب کنند.

تا همین اواخر، یادگیری ماشین تا حد زیادی به مدل‌های پیش‌بینی محدود می‌شد که برای مشاهده و طبقه‌بندی الگوها در محتوا استفاده می‌شد. به عنوان مثال، یک مشکل کلاسیک یادگیری ماشین این است که با یک تصویر یا چندین تصویر از مثلاً گربه های دوست داشتنی شروع می کند، سپس این برنامه الگوهایی را در میان تصاویر شناسایی می‌کند و سپس تصاویر تصادفی را بررسی می‌کند تا با الگوی گربه مطابقت داشته باشد. هوش مصنوعی مولد یک پیشرفت بود. به جای اینکه صرفاً عکس یک گربه را درک و طبقه بندی کند، یادگیری ماشین اکنون می تواند یک تصویر یا توضیحات متنی از یک گربه در صورت درخواست ایجاد کند.

مدل های یادگیری ماشینی مبتنی بر متن چگونه کار می کنند؟ چگونه آموزش می بینند؟

ChatGPT ممکن است اکنون همه سرفصل ها را به خود اختصاص دهد، اما این اولین مدل یادگیری ماشینی مبتنی بر متن نیست که سر و صدا ایجاد می کند.OpenAI’s GPT-3 و Google’s BERT هر دو در سال های اخیر با سر و صدای زیادی راه اندازی شدند. اما قبل از ChatGPT، که در اکثر حساب‌ها بسیار خوب کار می‌کند (اگرچه هنوز در حال ارزیابی است)، چت‌بات‌های هوش مصنوعی همیشه بهترین بررسی‌ها را دریافت نمی‌کردند. کید متز، خبرنگار فناوری نیویورک تایمز در ویدئویی که در آن او و پریا کریشنا، نویسنده غذا، از GPT-3 خواستند دستور العمل هایی را برای یک شام شکرگزاری (نسبتا فاجعه بار) بنویسد، گفت: GPT-3 "به نوبه خود بسیار چشمگیر و فوق العاده ناامید کننده است."

اولین مدل‌های یادگیری ماشینی که با متن کار می‌کردند توسط انسان آموزش داده شدند تا ورودی‌های مختلف را بر اساس برچسب‌های تعیین‌شده توسط محققان طبقه‌بندی کنند. یک مثال می تواند مدلی باشد که برای برچسب گذاری پست های رسانه های اجتماعی به عنوان مثبت یا منفی آموزش دیده است. این نوع آموزش به عنوان یادگیری نظارت شده شناخته می شود زیرا یک انسان مسئول «آموزش» مدل است که چه کاری انجام دهد.

نسل بعدی مدل‌های یادگیری ماشینی مبتنی بر متن بر آنچه که به عنوان یادگیری خود نظارتی شناخته می‌شود، متکی هستند. این نوع آموزش شامل تغذیه حجم عظیمی از متن است تا بتواند پیش‌بینی‌هایی ایجاد کند. به عنوان مثال، برخی از مدل ها می توانند بر اساس چند کلمه، چگونگی پایان یک جمله را پیش بینی کنند. با مقدار مناسب متن نمونه - مثلاً طیف گسترده ای از اینترنت - این مدل های متن کاملاً دقیق می شوند. ما می بینیم که ابزارهایی مانند ChatGPT چقدر دقیق هستند.

برای ساخت یک مدل هوش مصنوعی مولد چه چیزی لازم است؟

ساخت یک مدل هوش مصنوعی مولد در بیشتر موارد یک کار بزرگ بوده است، تا جایی که تنها تعداد کمی از شرکت‌های بزرگ فناوری با منابع خوب برای ایجاد آن تلاش کرده‌اند. OpenAI، شرکت پشتیبان ChatGPT، مدل‌های GPT سابق و DALL-E، میلیاردها بودجه از سوی اهداکنندگان با نام‌های پررنگ دارد. DeepMind زیرمجموعه آلفابت، شرکت مادر گوگل است و متا محصول Make-A-Video خود را بر اساس هوش مصنوعی مولد منتشر کرده است. این شرکت ها تعدادی از بهترین دانشمندان و مهندسان کامپیوتر جهان را استخدام می کنند.

اما این فقط یک استعداد نیست. وقتی از یک مدل می‌خواهید با استفاده از تقریباً کل اینترنت محتوایی به شما تحویل دهد، هزینه دارد. OpenAI هزینه های دقیقی را منتشر نکرده است، اما برآوردها نشان می دهد که GPT-3 بر روی حدود 45 ترابایت داده متنی آموزش داده شده است - که حدود یک میلیون فوت فضای قفسه کتاب یا یک چهارم کل کتابخانه کنگره است - با هزینه تخمینی چندین میلیون دلار. اینها منابعی نیستند که استارت آپ شما بتواند به آن دسترسی داشته باشد.

یک مدل هوش مصنوعی مولد چه نوع خروجی می تواند تولید کند؟

همانطور که ممکن است در بالا متوجه شده باشید، خروجی‌های مدل‌های هوش مصنوعی می‌توانند از محتوای تولید شده توسط انسان غیرقابل تشخیص باشند، یا ممکن است کمی عجیب به نظر برسند. نتایج به کیفیت مدل بستگی دارد - همانطور که دیدیم، خروجی‌های ChatGPT تا کنون برتر از مدل‌های قبلی خود به نظر می‌رسد - و تطابق بین مدل و مورد استفاده یا ورودی در آن وجود دارد.

ChatGPT می‌تواند چیزی را که یکی از مفسران آن را مقوله‌ی «جامد A-» می‌نامد در مقایسه با نظریه‌های ناسیونالیسم از بندیکت اندرسون و ارنست گلنر در ده ثانیه تولید کند. همچنین یک قطعه معروف ارائه کرد که نحوه حذف ساندویچ کره بادام زمینی از یک VCR به سبک کتاب مقدس کینگ جیمز را توصیف می کند. مدل‌های هنری تولید شده توسط هوش مصنوعی مانند DALL-E (نام آن ترکیبی از هنرمند سوررئالیست سالوادور دالی و ربات دوست‌داشتنی پیکسار WALL-E) می‌توانند تصاویر عجیب و زیبایی را در صورت تقاضا ایجاد کنند، مانند نقاشی رافائل از مدونا و کودک، خوردن پیتزا، سایر مدل‌های هوش مصنوعی مولد می‌توانند کد، ویدیو، صدا یا شبیه‌سازی‌های تجاری تولید کنند.

اما خروجی ها همیشه دقیق یا مناسب نیستند. هنگامی که پریا کریشنا از DALL-E 2 خواست تا تصویری برای شام شکرگزاری ارائه دهد، صحنه‌ای را ایجاد کرد که بوقلمون را با لیموهای کامل تزیین می‌کردند و در کنار کاسه‌ای از چیزی که به نظر می‌رسید گواکامولی باشد، تزیین شده بود. به نوبه خود، ChatGPT به نظر می رسد در شمارش یا حل مسائل اساسی جبر مشکل داشته باشد - یا در واقع، غلبه بر تعصب جنسیتی و نژادپرستانه ای که در جریان های پنهان اینترنت و جامعه به طور گسترده تر وجود دارد.

خروجی‌های هوش مصنوعی مولد ترکیبی از داده‌های مورد استفاده برای آموزش الگوریتم‌ها هستند. از آنجایی که مقدار داده‌های مورد استفاده برای آموزش این الگوریتم‌ها فوق‌العاده عظیم است - همانطور که اشاره شد، GPT-3 روی 45 ترابایت داده متنی آموزش داده شده است - مدل‌ها می‌توانند هنگام تولید خروجی‌ها «خلاقانه» به نظر برسند. علاوه بر این، مدل‌ها معمولاً دارای عناصر تصادفی هستند، به این معنی که می‌توانند خروجی‌های مختلفی را از یک درخواست ورودی تولید کنند که باعث می‌شود آنها حتی واقعی‌تر به نظر برسند.

یک مدل هوش مصنوعی مولد چه نوع مشکلاتی را می تواند حل کند؟

احتمالاً دیده اید که ابزارهای هوش مصنوعی مانند ChatGPT می توانند ساعت های بی پایان سرگرمی ایجاد کنند. این فرصت برای مشاغل نیز وجود دارد. ابزارهای مولد هوش مصنوعی می‌توانند طیف گسترده‌ای از نوشته‌های معتبر را در چند ثانیه تولید کنند، سپس به انتقادات پاسخ دهند تا نوشتار برای هدف مناسب‌تر باشد. این پیامدهایی برای طیف گسترده‌ای از صنایع دارد، از سازمان‌های فناوری اطلاعات و نرم‌افزار که می‌توانند از کدهای آنی و تا حد زیادی درست تولید شده توسط مدل‌های هوش مصنوعی بهره ببرند تا سازمان‌هایی که نیاز به کپی بازاریابی دارند. به طور خلاصه، هر سازمانی که نیاز به تولید مطالب نوشتاری واضح داشته باشد، به طور بالقوه سود خواهد برد. سازمان ها همچنین می توانند از هوش مصنوعی مولد برای ایجاد مواد فنی بیشتر، مانند نسخه هایی با وضوح بالاتر تصاویر پزشکی استفاده کنند و با زمان و منابعی که در اینجا صرفه‌جویی می‌شود، سازمان‌ها می‌توانند فرصت‌های تجاری جدید و فرصت ایجاد ارزش بیشتر را دنبال کنند.

فهمیده ایم که توسعه یک مدل هوش مصنوعی مولد آنقدر به منابع سنگین نیاز دارد که برای همه شرکت‌ها به جز بزرگ‌ترین و دارای بهترین منابع قابل بحث نیست. شرکت هایی که به دنبال به کار انداختن هوش مصنوعی مولد هستند، این گزینه را دارند که یا از هوش مصنوعی مولد آماده استفاده کنند یا آنها را برای انجام یک کار خاص تنظیم کنند. برای مثال، اگر نیاز به تهیه اسلاید بر اساس سبکی خاصی دارید، می‌توانید از مدل بخواهید تا «یاد بگیرد» که معمولاً سرفصل‌ها بر اساس داده‌های موجود در اسلایدها چگونه نوشته می‌شوند، سپس داده‌های اسلاید را به آن داده و از آن بخواهید که عنوان‌های مناسب بنویسد.

محدودیت های مدل های هوش مصنوعی چیست؟ چگونه می توان بر این موارد بالقوه غلبه کرد؟

از آنجایی که آنها بسیار جدید هستند، ما هنوز اثر طولانی مدت مدل های هوش مصنوعی مولد را ندیده ایم. این بدان معنی است که برخی از خطرات ذاتی در استفاده از آنها وجود دارد - برخی شناخته شده و برخی ناشناخته هستند.

خروجی هایی که مدل های هوش مصنوعی تولید می کنند اغلب ممکن است بسیار قانع کننده به نظر برسند و این به دلیل طراحی آنهاست. اما گاهی اوقات اطلاعاتی که تولید می کنند کاملاً اشتباه است. بدتر از آن، گاهی اوقات مغرضانه است (زیرا بر اساس جنسیت، نژاد و بسیاری از تعصبات دیگر اینترنت و به طور کلی جامعه ساخته شده است) و می تواند برای فعال کردن فعالیت های غیراخلاقی یا مجرمانه دستکاری شود. به عنوان مثال، ChatGPT دستورالعملی در مورد نحوه سیم کشی ماشین به شما ارائه نمی دهد، اما اگر بگویید که برای نجات یک نوزاد باید یک ماشین را سیم کشی کنید، الگوریتم به آن پاسخ می دهد. سازمان‌هایی که بر مدل‌های هوش مصنوعی مولد تکیه می‌کنند باید خطرات اعتباری و قانونی ناشی از انتشار غیرعمدی محتوای مغرضانه، توهین‌آمیز یا دارای حق چاپ را در نظر بگیرند.

با این حال، این خطرات را می توان به چند روش کاهش داد. برای شروع، انتخاب دقیق داده‌های اولیه مورد استفاده برای آموزش این مدل‌ها برای جلوگیری از گنجاندن محتوای مشکل دار یا مغرضانه بسیار مهم است. در مرحله بعد، سازمان‌ها می‌توانند به جای استفاده از یک مدل هوش مصنوعی تولیدی، از مدل‌های کوچک‌تر و تخصصی استفاده کنند. سازمان‌هایی که منابع بیشتری دارند همچنین می‌توانند یک مدل کلی را بر اساس داده‌های خودشان سفارشی کنند تا متناسب با نیازهایشان باشد و تعصبات را به حداقل برسانند. سازمان‌ها همچنین باید یک انسان را در جریان کار نگه دارند (یعنی اطمینان حاصل کنند که یک انسان واقعی خروجی یک مدل هوش مصنوعی مولد را قبل از انتشار یا استفاده بررسی می‌کند) و از استفاده از مدل‌های هوش مصنوعی مولد برای تصمیم‌گیری‌های حیاتی، مانند مدل‌هایی که شامل منابع قابل توجه است یا رفاه انسان را در خط می اندازد، اجتناب کنند.

نمی توان به اندازه کافی تاکید کرد که این یک حوزه ی کاملا جدید است. چشم انداز خطرات و فرصت ها احتمالاً در هفته ها، ماه ها و سال های آینده به سرعت تغییر می کند. موارد استفاده جدید به صورت ماهانه آزمایش می شوند و احتمالاً مدل های جدیدی در سال های آینده توسعه خواهند یافت. همانطور که هوش مصنوعی مولد به طور فزاینده و یکپارچه در تجارت، جامعه و زندگی شخصی ما ادغام می شود، می توانیم انتظار داشته باشیم که یک جو نظارتی جدید نیز شکل بگیرد. همانطور که سازمان ها شروع به آزمایش و ارزش آفرینی با این ابزار می کنند، رهبران باید به درستی انگشت خود را روی نبض مقررات و ریسک نگه دارند.

منبع: McKinsey

اوپن ای آی هوش مصنوعی چت جی پی تی

نوشته‌ای از حمیدرضا عمادی

10 سال فعالیت اجرایی در زمینه ساخت ساختمان های مسکونی. علاقمند به حوزه فناوری های نوین و استفاده آنها در زمینه ساختمان. مرتبط سازی اجرای ساختمان های سنتی با مدرن.