ماشينهايي که مانند انسان قدرت يادگيري دارند.
محققان مدلي محاسباتي را طراحي کردهاند که منعکس کنندهي شيوهي کارکرد مغز است. ماشينهايي که ميتوانند اشيا را تمييز دهند و از قدرت يادگيري ابتدايي برخوردارند، به محققان کمک ميکنند تا فرآيند يادگيري مغز انسان را بهتر بشناسند.
سيستمهاي تشخيص اشيا روز به روز در حال پيشرفت و پيچيده تر شدن هستند و از جمله موفق ترين نمونههاي تجاري اين سيستمها، الگوريتم شناسايي چهره است که در فيس بوک به کار رفته است.
اما اين گونه سيستمها فقط ميتوانند بر اساس ميليونها تصويري که شناختهاند عمل کنند، در حالي که انسانها به شيوهي ديگري تصاوير را تشخيص ميدهند. اگر مغز فقط چند عدد تصوير را دريافت کند، ميتواند با آنها تصاوير جديدي را بازآفريني کند.
چهار سال قبل گروهي به سرپرستي توماسو پوگيو (Tomaso Poggio) از مرکز پژوهشهاي مغز دانشگاه MIT يک مدل محاسباتي را طراحي کردند که عملکردش بيشتر از ساير سيستمهاي شناسايي به عملکرد مغز انسان نزديک است. اين محققان در مقالات خود اثبات کردهاند که سيستم يادگيري ماشيني با مدل ابداعي آنها ميتواند در چندين نمونهي آزمايش شده بسيار قابل اعتماد باشد. آنها همچنين نشان دادهاند که مدل يادگيريشان تطابقهاي بسياري با شواهد تجربي بدست آمده دربارهي نحوهي يادگيري مغز بشر دارد. پوگيو که استاد علوم مغز در دانشگاه MIT است ميگويد: «اگر شما چهرهي فردي را از يک فاصلهي دور ببينيد و پس از مدتي همان فرد را در يک فاصلهي نزديک ملاقات کنيد، اين دو تصوير کاملاً با يکديگر متفاوت هستند. اما مغز ما احتياج به نمونههاي مختلف از حالتهاي فاصلههاي متعدد از چهرهي افراد ندارد تا بتواند دوباره آنها را تشخيص دهد. بلکه يک تصوير ميتواند نمايندهي حالتهاي مختلف يک شي باشد.»
اين پديده که يک شي نمايندهاي از حالات مختلف محسوب شود، يعني تغييراندازه، فاصله، مکان و چرخش اختلالي در شناسايي آن شي ايجاد نميکند. محققان رايانه مدتهاست که به دنبال الگوريتمهايي هستند که با اين روش به شناسايي بپردازند. اما گروه پوگيو اندکي بيشتر پيش رفتهاند و عملکرد دقيق مغز را به دنياي ماشينها وارد کردهاند.
آنچه سلولهاي عصبي محاسبه ميکنند:
سلولهاي عصبي يا همان نورونها سلولهايي طويل و باريک با انتهاي انشعابي هستند. در قشر بصري مغز، يعني جايي که پردازشهاي ديداري انجام ميشود هر نورون حدود ده هزار انشعاب در انتهاي خود دارد. در نتيجه هر دو نورون از طريق ۱۰۰۰۰ مسير مجزا که سيناپس نام دارند با هم اتصالهاي شيميايي دارند. هر سيناپس وزن مخصوص خود را دارد که تعيين ميکند ظرفيتش براي دريافت سيگنال چقدر است. تمامي سيگنالهايي که از اين ده هزار سيناپس دريافت ميشوند، به بدنهي اصلي نورون ميروند. کارکرد سيناپسها و الگوي الکتريکي تغيير وزن آنها در طول زمان با توجه به مکانيسم عادتهاي بدن و خاطرههاي هر فرد تعيين ميشود.
يکي از مهمترين عملگرهايي که در رياضيات در شاخهي جبر خطي تعريف ميشود، ضرب نقطهاي است که در آن مؤلفهها تک به تک با هم ضرب ميشوند و در نهايت حاصل ضربها با هم جمع ميشوند. در قشر بصري مغز، براي يافتن تعداد خروجيهاي عصبي بايد ده هزار مؤلفه را در نظر بگيريم که به طور نقطهاي در هم ضرب ميشوند. اين محاسبهي بسيار عظيمي است که مغز ما فقط در يک آن ميتواند آن را اجرا کند!
گروه پوگيو يک الگوريتم شناسايي اشيا با يک تصوير نماينده را طراحي کردهاند که مبتني بر ضرب نقطهاي است. تصور کنيد که شما يک تصوير را در اختيار داريد و تصاوير بعدي را فقط اندکي ميچرخانيد، طوري که در نهايت با تهيهي ۲۴ فريم از تصوير مورد نظر، چرخش ۳۶۰ درجهاي را دنبال کردهايد.
حال تصور کنيد که تصوير ناآشنايي را به شما ارائه دهند. شما ميتوانيد با تفکيک رنگها ۲۴ تصوير را در ذهنتان خلق کنيد.
تغييرناپذيري:
حال اگر تصويري از همان جسم را به شما ارائه کنند، در حالي که نود درجه چرخيده باشد، شما با استفاده از روش ضرب نقطهاي مغزتان دوباره همان ۲۴ تصوير قابل شناسايي را به دست خواهيد آورد. يعني اين بار به جاي اين که تصويرتان را از صفر درجه دنبالهسازي کنيد، از ششمين تصوير آغاز کردهايد. اما نتيجهاي که به دست ميآيد، مجدداً ۲۴ تصوير مجزا است.
بنابراين در چنين الگوريتمي اعداد نسبت به چرخش ناوردا (مستقل) هستند. به همين دليل ارائهي تصوير در مکانهاي مختلف يا در اندازههاي مختلف هم در اين توالي تأثيري نخواهد داشت و حاصلهاي ضرب نقطهاي الگوريتم نسبت به مکان و يا اندازه ناوردا خواهد بود.
پوگيو و همکارانش در مقالهي خود نشان دادهاند که اگر هدف توليد يک شي ثابت باشد که نسبت بهاندازه، چرخش و مکان ناوردا باشد، ميبايست تصاوير را در فيلترهاي گابور (Gabor filters) بچينند. فيلترهاي گابور اصطلاحي است که براي معرفي فرآيند پردازش تصاوير در مغز استفاده ميشود. اين عملکرد توسط سلولهاي سادهي قشر بينايي مغز اجرا ميشود.
سه بعد:
در حالي که اين روش دربارهي تصاوير روي سطح نتيجه داده است، اما نميتوان آن را به همين سادگي در سه بعد نيز به کار برد. حاصل ضرب نقطهاي تصاوير يک خودرو از مقابل تفاوت بسياري با حاصل ضرب نقطهاي تصاوير همان خودرو از زاويهي کناري دارد. پوگيو و همکارانش نشان دادهاند که اگر زاويههاي مختلف يک جسم را به عنوان تصاوير جديد معرفي کنند، ضرب نقطهاي ميتواند همچنان کاربرد داشته باشد. آنها دريافتهاند که نواحي ويژهاي در قشر بينايي مغز وجود دارند که مسئول شناسايي زواياي مختلف چهره و اشيا هستند و ميتوانند ارتباط آنها را با هم تشخيص دهند.
الگوريتمي که در دانشگاه MIT طراحي شده ميتواند با استفاده از تصاوير ثابت و عملگر ضرب نقطهاي هزاران تصوير تصادفي را شناسايي کند. در اين الگوريتم طبقه بنديهاي خاصي پيشبيني شده است که شبيه به طبقهبنديهاي مغز انسان است. کريستوف کخ (Christof Koch)، سرپرست مؤسسهي علوم مغزي آلن (Allen Institute for Brain Science) ميگويد: «اين نوع الگوريتمها ميتوانند شکاف عميقي که ميان مغز انسان و يادگيري ماشيني وجود دارد را پر کنند. چهارچوبهاي رياضي در کنار شواهد تجربي از عملکرد مغز به ما کمک ميکنند سيستمهاي هوش مصنوعي قدرتمندي را طراحي کنيم.»
منبع:
MIT news
منابع مفید:
الگوریتم درک و شهود
شبکه های عصبی مصنوعی
پردازش داده های مغز
هوش مصنوعی: ۱ - ۲
هوش مصنوعی و الگوریتم های یادگیری
تراشه ای که ذهن انسان را می خواند
مغز اندیشه روان
یادگیری کامپیوترها
مغز انسان - ویکی پدیا
The Electronic Brain? Your Mind Vs. a Computer
Neurons introduction
Synapthic Transmission