تشخیص تصاویری که به راحتی توسط ما انجام میشود توسط کامپیوتر به سختی صورت میگیرد
سالها، دانشمندان در تلاش بودند تا به کامپیوترها بیاموزند تا مثل انسانها بینند و تحقیق جدیدی نشان داده است که کامپیوترها در شناسایی اشیاء پیشرفت کردهاند. بهگزارش سایت «ساینس دیلی» (Science Daily) و به نق از مجلهی «زیستشناسی کامپیوتری» (Computational Biology) تحقیق جدیدی از دانشگاه «امآیتی» (MIT) نشان داده است که به این نکته نیز باید توجه شود که این موفقیتهای ظاهری ممکن است گمراهکننده باشد زیرا این آزمایشها سهواً بهگونهای طراحی شدهاند که یک نوع تفکر حمایت از کامپیوترها در پشت آن قرار دارد.. اهمیت این تحقیق به خاطر کاربرد وسیعش در اتومبیلهای هوشمند تا اعضای مصنوعی بینایی برای نابینایان است. ادعا میشود نمونههای محاسبهای جدید پیشرفتهای ظاهراً مؤثری داشته است بهگونهای که موفقیت در طبقهبندی 60 درصد از مجموعههای تصاویر عکاسی معمولی را نشان میدهد. این آزمون بر روی پایگاه دادهی وسیع و کاربردی «پالتک 101» (Paltech101) انجام شده است و بدین ترتیب الگوریتمهای بینایی کامپیوتر در برابر گسترهای از عکسها آزموده شده است که در جهان واقعی دیده میشود. اگرچه، «جیمز دیکارلو» (James DIcarlo) عصبشناسی در مؤسسهی «مکگاورن» (McGovern) برای پژوهشهای مغزی در «امآیتی» (MIT)، «نیکولاس پینتو» (Nicolas Pinto) و «دیوید کاکس» (David Cox) دانشجوی دورهی تحصیلات تکمیلی از مؤسسهی «رولند» (Rowland) دانشگاه «هاروارد» (Harvard) به این نتیجه رسیدهاند که این مجموعه از عکسها دارای عکسهایی بودهاند که نواقصی داشتند که کامپیوترها قادر نبودند بهطور موفقیتآمیزی آنها را تشخیص دهند بهخاطر اینکه با تصاویر بسیار متنوعی مواجه میشود به عنوان مثال، عکاسها تمایل دارند اشیاء در مرکز یک قاب عکس قرار گیرد و یا اینکه زمینهها و چشماندازهای خاصی را ترجیح میدهند. این سیستم بینایی، با اشیایی در موقعیتهایی بسیار وسیع مواجه میشوند. بنابراین سیستم بینایی بهطور متضاد با اشیاء در شرایط بسیار متفاوتی مواجه میشوند. «دیکارلو» (DiCarlo) سرپرست گروه پژوهشی توضیح داد: تشخیص تصاویری که به راحتی توسط ما انجام میشود توسط کامپیوتر به سختی صورت میگیرد. مشکل اصلی، تنوع تصویرها است. هر شی مشخصی بر حسب زمینه، شدت نور، جهت، فاصله و موقعیتش، بینهایت تصویر بر روی شبکیه ایجاد میکند. در آزمایش تشخیص اشیا توسط کامپیوتر گروه پژوهشی متوجهی نواقصی شد. این امر توسط یک اسباببازی مدل رایانهای با الهام از اولین مراحل مسیر بینایی در مغز انجام شد. نرونهای عصبی مصنوعی با ویژگیهایی شبیه به «کورتکسهای» (Cortex) بینایی اولیهی مغز هر نقطه از تصویر را تجزیه و تحلیل کرده و اطلاعات سطح پایین دربارهی موقعیت و جهت خطوط مرزی آنرا ضبط مینماید. این مدل فاقد تجزیه و تحلیل پیچیدهای است که در مراحل بعد فرایند بینایی برای استخراج اطلاعات سطح بالاتر بهوقوع میپیوندد. این اطلاعات سطح بالاتر شامل صحنههای بینایی شامل شکل، سطح و فضای بین اشیاء میباشد. محققان این مدل را بهعنوان یک «آدم پوشالی» (Strow Man) معرفی کردهاند و انتظار دارند تا با این شکست اولیه، راه را برای موفقیتهای بعدی باز کنند. موقعیکه آنها این سیستم را روی تصویرهای «کالتک 101» (Caltech101) آزمایش کردند، مدل بهطور شکفتانگیزی خوب و با عملکردی شبیه یا بهتر از «سیستمهای تشخیص اشیای پنجمرحلهای» (Five State of the Art Objects Recognition) کار کرد. «پیتنو» (Pinto) توضیح داد: این سیستم چگونه خواهد بود؟ فکر کردیم که تصویرهای طبیعی فرضی در آزمونهای بینایی کامپیوتری واقعاً مسألهی اصلی نخواهد بود و چگونگی فرایند تشخیص، «آسان» یا «سخت» ناصحیح است. در آزمایش این تفکر، محققان یک آزمایش با دقیق و کنترل شدهای را طراحی کردند. با استفاده از تنها دو نوع صفحه و اتومبیل تنوع موقعیت، اندازه و جهت را برای انعکاس بهتر دامنهی متنوعی از دنیای واقعی فراهم کردند. «کاکس» (COX) میگوید: تنها با آزمون تشخیص دو نوع شی این آزمون برای اسباببازی مدل کامپیوتری باید سادهتر باشد اما نشان داد که سختتر است بدین ترتیب گروه پژوهشی مذکور چنین نتیجه گرفتند: «مدل ما بر روی مجموعهی عکسهای «کالتک» خوب عکل کرد اما این نتیجه بهخاطر این نیست که مدل ما مدل خئبی بوده است بلکه بهاین دلیل بوده است که تصویرها دردنیای واقعی نیاز به ضبط تنوع دنیای واقعی ندارد. در نتیجه، محققان برای توجیح تصاویر و استانداردهای موجود به بحث و بررسی آنها پرداختند که توسط مجموعهی بینایی کامپیوتر برای مقایسهی توسعهی مدلها و اندازهها بهکار میرود. آنها میگویند: قبل از اینکه کامپیوترها بتوانند به توان مغز انسان نزدیک بشوند، محققان باید بهتر بفهمند که چرا وظیفهی بازشناسی اشیا هنوز مشکل است و تواناییهای مغز همچنان با عظمت هستند. |