صفحه اصلی » مقالات » جدال خوش‌نویسی میان انسان و روبات
موضوعات
جدال خوش‌نویسی میان انسان و روبات   488
یادگیری ماشینی در مسیر تکامل

مسابقه خوش‌نویسی میان انسان و روبات



در حوزه هوش مصنوعی و علوم مرتبط با آن؛ یادگیری ماشینی این روزها بازار بسیار گرمی دارد. یادگیری ماشینی را می‌توان مغز هوش مصنوعی در نظر گرفت. هر چه پیش‌رفت‌ها در این شاخه با سرعت بیشتری به پیش برود، در نتیجه شاهد سریع‌تر شدن هوش‌مصنوعی و دقیق‌تر شدن آن خواهیم بود. گزارش‌ها نشان می‌دهد محققان مؤسسه MIT به راه‌کار جدیدی در این زمینه دست یافته‌اند.
یادگیری ماشینی از جمله روش‌هایی است که با استفاده از داده‌های حجیم، به هوش مصنوعی کمک می‌کند، دنیای پیرامون خود را حس کند. به تازگی یک تیم از دانشمندان، الگوریتمی را طراحی کرده‌اند که به ماشین‌ها این توانایی را می‌دهد تا آموخته‌های انسان‌ها را ضبط کند. به‌طوری که کامپیوترها توانایی تشخیص و رسم سمبل‌های بصری ساده را داشته باشند. اما نکته‌ای که این الگوریتم را از نمونه‌های مشابه آن متمایز می‌سازد به توانایی رسم دقیق آن باز می‌گردد. در آزمایشی که توسط این محققان انجام شد، نزدیک به 25 درصد افراد شرکت‌کننده در این آزمایش نتوانستند تفاوت یک دست خط ماشینی را از یک دست خط انسانی شناسایی کنند.
نتیجه دستاوردهای این گروه تحقیقاتی در آخرین شماره ژورنال Science به چاپ رسیده است. این پروژه تحقیقاتی نه تنها به میزان چشم‌گیری زمانی را که هوش مصنوعی صرف شناختن و "یادگرفتن" مفاهیم جدید می‌کند کاهش می‌دهد، بلکه حیطه انجام وظایف خلاقانه‌تر توسط ماشین‌ها را گسترش خواهد داد. این الگوریتم یک ماشین را قادر می‌سازد، علائم بصری را رسم کرده و آن‌ها را تشخیص دهد. علائمی که در بعضی موارد انسان‌ها قادر به تشخیص آن نیستند. پژوهش‌گران این پروژه تحقیقاتی اعلام کرده‌اند با وجود همه عیوبی که در ما انسان‌ها وجود دارد، انسان‌ها در حوزه یادگیری از قدرت بسیار بالایی بهره می‌برند. خواه در حال یادگیری نوشتن، انجام فعالیتی با یک ابزار یا در حال انجام حرکات ورزشی باشند. انسان‌ها قبل از آن‌که یک فرآیند تکرار شونده را انجام دهند تنها نیازمند مشاهده چند نمونه هستند. برندن لیک استاد دانشگاه نیویورک در این‌باره گفته است: «نتایج تحقیقات نشان می‌دهد، مهندسی معکوس چگونه به انسان‌ها کمک می‌کند درباره مشکلات فکر کنند. ما می‌توانیم الگوریتم بهتری را بر اساس همین ایده پیاده‌سازی کنیم. » همان‌گونه که در تصویر زیر مشاهده می‌کنید مردم با در اختیار داشتن داده‌‌های محدود توانایی یادگیری مفاهیم پیشرفته را دارند.


اما کامپیوترها در مقایسه با انسان‌ها اوضاع کاملا متفاوتی دارند. الگوی شناسایی چهره‌های مشخص یا شناسایی دست‌نوش‌های روی یک چک یا یک کوپن که امروزه بیشتر کامپیوترها از آن استفاده می‌کنند، یک منحنی یادگیری گسترده است که ممکن است به صدها یا هزاران نمونه جزء به جزء نیازمند بوده تا هوش مصنوعی توانایی تشخیص دقیق آن‌را داشته باشد. روسلان سالاکدینوف استادیار علوم کامپیوتر در دانشگاه تورنتو کانادا که همراه با جاشوا تننباوم استاد علوم شناختی و مغز در دپارتمان MIT در این پروژه مشارکت داشته است، می‌گوید: «ساخت ماشین‌هایی که همانند انسان‌ها با حداقل داده‌ها توانایی یادگیری مفاهیم جدید را داشته باشند کار بسیار مشکلی است. تکرار توانایی‌ها از هیجان‌برانگیز‌ترین بخش‌هایی است که در ارتباط با یادگیری ماشینی، آماری، بینایی ماشینی و علوم شناختی وجود دارد.»
 
سالاکدینوف همراه با استادیار خودش جفری هینتون نزدیک به ده سال پیش مقاله‌ای در ارتباط با شبکه‌های عصبی عمیق نوشت. الگوریتمی که در آن زمان با استفاده از ده دست خط برای نوشتن اعداد 0 تا 9 از 6000 هزار نمونه استفاده می‌کرد. به‌طوری که در مجموع 60 هزار نمونه آزمایشی در اختیار این الگوریتم عصبی قرار گرفته بود. اما به نظر می‌رسد تحقیق جدید این فرآیند زمان‌بر را متحول ساخته است. پژوهش‌گران برای پیاده‌سازی این الگوریتم ویژه‌ چهارچوب یادگیری برنامه بیز را طراحی کردند. چهارچوبی که مفاهیم را به ساده‌ترین شکل ممکن در اختیار کامپیوترها قرار می‌دهد. نکته‌ای که این الگوریتم را منحصر به فرد می سازد به توانایی خودباز اصلاحی یا به عبارت دقیق‌تر خود برنامه‌ای آن باز می‌گردد. این ویژگی به الگوریتم یاد شده اجازه می‌دهد توانایی ساخت کدهایی برای باز تولید سمبل‌های بصری ویژه را داشته باشد.
این الگوریتم به جای آن‌که در هر بار نوشتن، تنها کاراکترهای یاد گرفته شده یکسانی را به یکدیگر وصل کند، از الگوریتم احتمال تساوی سمبل‌ها در هر نمونه متناوب برای ترسیم استفاده می‌کند. این کار بر مبنای یک مدل مولد انجام شده که اعلام می‌دارد چگونه کاراکتری باید نوشته شود. در حالی که الگوریتم‌های تشخیص الگوهای استاندارد برای نشان دادن مفاهیم از تنظیمات پیکسل‌ها یا مجموعه‌ای از قابلیت‌ها استفاده می‌کنند، رویکرد یادگیری BPL بر مبنای فرآیندهای "مدل‌های مولد" در جهان قرار دارد. به‌طوری که فرآیند یادگیری بر مبنای "ساختمان مدل" یا "توضیحاتی" که داده‌هایی را در اختیار الگوریتم قرار می‌دهد رفتار می‌کند. در مورد نوشتن و تشخیص نامه‌ها، BPL به گونه‌ای طراحی شده است تا توانایی ضبط هر دو حالت خواص حروف و علت ایجاد آن‌ها در فرآیندهای دنیای واقعی را داشته باشد. ترکیب این دو عامل باعث می‌شود تا الگوریتم به شیوه مؤثرتری از داده‌ها استفاده کند. این مدل همچنین ویژگی "یاد می‌گیرد برای یادگیری" را با استفاده از مفاهیم قبلی برای سرعت بخشیدن به یادگیری مفاهیم جدید مورد استفاده قرار می‌دهد. به‌طور مثال بهره‌مندی از دانش الفبای لاتین برای یادگیری الفبای یونانی نمونه‌ای از این موارد به شمار می‌رود.


محققان از این الگوریتم برای بازنویسی 1600 نوع دست خط که از 50 سیستم دست‌نویس جهانی همچون سانسکریت، تیتی، گجراتی (هند و اروپایی)، گلاگولیتیک (الفبای بلغاری) دریافت شده است، استفاده کردند. این الگوریتم حتی کاراکترهایی که در برنامه تلویزیونی فوتوراما مورد استفاده قرار گرفته بود را نیز بازنویسی کرد. یک مرتبه که ماشین کاراکترها را یاد گرفته باشد و توانایی نوشتن مستقل آن‌ها را داشته باشد، محققان یک آزمون تورینگ بصری- را روی آن انجام می‌دهند. محققان این آزمایش را به این دلیل انجام می‌دهند تا اطلاع پیدا کنند آیا انسان‌ها توانایی تشخیص سمبل‌های ترسیم شده توسط این ماشین را از نمونه‌های انسانی دارند یا خیر.
نتایج به دست آمده از این آزمایش بسیار جالب توجه بوده است، به‌طوری که نزدیک به 25 درصد افراد شرکت‌کننده در این آزمایش موفق به شناسایی سمبل‌های نوشته شده با ماشین از نمونه‌های انسانی نشدند. در نتیجه می‌توان گفت عملکرد این ماشین بسیار به نمونه انسانی نزدیک بوده است. جاشوا تننباوم محقق علوم شناختی در مؤسسه فناوری ماساچوست MIT در این‌باره گرفته است: «کودکان قبل از آن‌که به مهد کودک وارد شوند، یاد می‌گیرند مفاهیم جدید را تنها با مشاهده یک نمونه تشخیص دهند. به‌طوری که حتی این توانایی را دارند تا نمونه‌هایی که هنوز آن‌ها را مشاهده نکرده‌اند را تجسم کنند. البته ما هنوز در آغاز راه هستیم و  برای رسیدن به زمانی‌که ماشین‌ها همانند بچه‌های انسان‌ها با هوش باشند فاصله زیادی داریم. این نخستین باری است که ما ماشین‌هایی در اختیار داریم که توانایی یادگیری و استفاده از یک کلاس بزرگ از مفاهیم دنیای واقعی را دارند. »
ماشینی که توانایی فریب دادن شما را داشته باشد ممکن است گزینه ایده‌آلی برای تغییر جهان به شمار نرود، اما کاربردهای بالقوه‌ای در ارتباط با مطالعه سریع الگوریتم‌ها را دارد. تصور کنید اگر اسمارت‌فون شما توانایی انجام چنین کاری را داشته باشد، شما از یک لغت استفاده می‌کنید و اسمارت‌فون‌تان از شما سؤال می‌کند معنای آن چیست؟ در زمان بعدی اسمارت‌فون توانایی تشخیص آن‌را خواهد داشت. بهبود توانایی ماشین در سرعت بخشیدن به یادگیری مفاهیم جدید تأثیر بسیار زیادی روی بسیاری از وظایف مرتبط با هوش مصنوعی از جمله پردازش تصویر، تشخیص گفتار، تشخیص چهره، درک زبان طبیعی و بازیابی اطلاعات خواهد داشت.
 



انتشار: 1394/10/27 - 18:57:23