همگام ماندن با آخرین تحقیقات انجامشده در زمینهی هوش مصنوعی، میتواند تجربهی غیرعادی و عجیبی باشد. از طرفی با آخرین آزمایشهای انجامشده در این حوزه و مقالههایی روبهرو هستیم که هرکدام میتوانند بالقوه یکی از بزرگترین انقلابهای صنعتی همهی اعصار باشند و از طرف دیگر، مواردی مشاهده میکنیم که ممکن است گاهی اوقات عجیب و غریب و گاهی خندهدار باشند.
شرکت دیپمایند که زیرمجموعه هوش مصنوعی گوگل است، در مقالهای با عنوان «پدیدار شدن رفتارهای حرکتی در محیطهای غنی» از تحقیقاتی در زمینهی چگونگی استفاده از یادگیری تقویتی (RL) در آموزش یک کامپیوتر برای مسیریابی در محیطهای پیچیده و ناآشنا صحبت میکند. این یکی از زمینههای اساسی مطرح در هوش مصنوعی است که در حال حاضر در محیطهای مجازی محک زده میشود؛ ولی در آیندهای نهچندان دور منجر به ساخت رباتهایی خواهد شد که مسیر خود را از طریق راهپله تا منزل شخصی صاحبشان پیدا خواهند کرد.
تمام حرکتهایی که این ربات مجازی انجام میدهد، بهصورت خودکار فراگرفته است. پرش، جهش و حرکت کردن از زیر موانع، تمام اینها حرکاتی هستند که این کامپیوتر بهتنهایی بهعنوان بهترین روش برای جابجایی از یک نقطه به نقطهی دیگر آموخته است. تمام کاری که برنامهنویسان دیپمایند انجام دادهاند، وصل کردن تعدادی سنسور مجازی به این ربات بوده است. (که بتواند برای مثال تشخیص بدهد در وضعیت ایستاده قرار دارد یا نه). سپس این ربات برای حرکت به جلو تشویق میشود. بقیهی کارها توسط هوش مصنوعی انجام میشود که با آزمون و خطا، بهترین راه را برای حرکت پیدا میکند.
نوآوری که در این برنامه انجام شده، این است که محققان توسط این آزمایش میتوانند بررسی کنند که شرایط سخت چگونه میتواند به رفتار پیچیده و حرکات مشخص رباتها منجر شود. بهطور معمول، یادگیری از طریق تقویت و اصلاح رفتارهای پیشین ممکن است منجر به حرکات غیر معمولی بشود که با تغییر جزئی شرایط، منجر به خطا و شکست شوند. مثل کودکی که نحوهی استفاده از پلهی معمولی خانه را میداند؛ ولی در دفعات اول استفاده از پلهبرقی شکست میخورد. این آزمایش ثابت کرد که تحت این شرایط، یادگیری تقویت میتواند برای حرکات پیچیده استفاده شود.
منلع:زومیت