رشد > فعاليت‌های علمی

متن كامل خبر

طراحی سیستم بینایی کامپیوتری توسط محققان دانشگاه «ام‌آی‌تی» (MIT)

تاريخ خبر : 19/11/1386

امتياز بده :

ارسال به دوست

تعدادمشاهده : 1015

- تشخیص تصاویری که به راحتی توسط ما انجام می‌شود توسط کامپیوتر به سختی صورت می‌گیرد

طراحی سیستم بینایی کامپیوتری

توسط محققان دانشگاه «ام‌آی‌تی» (MIT)

تشخیص تصاویری که به راحتی توسط ما انجام می‌شود توسط کامپیوتر به سختی صورت می‌گیرد

سال‌ها، دانشمندان در تلاش بودند تا به کامپیوترها بیاموزند تا مثل انسان‌ها بینند و تحقیق جدیدی نشان داده است که کامپیوترها در شناسایی اشیاء پیشرفت کرده‌اند.

به‌گزارش سایت «ساینس دیلی» (Science Daily) و به نق از مجله‌ی «زیست‌شناسی کامپیوتری» (Computational Biology) تحقیق جدیدی از دانشگاه «ام‌آی‌تی» (MIT) نشان داده است که به این نکته نیز باید توجه شود که این موفقیت‌های ظاهری ممکن است گمراه‌کننده باشد زیرا این آزمایش‌ها سهواً به‌گونه‌ای طراحی شده‌اند که یک نوع تفکر حمایت از کامپیوترها در پشت آن قرار دارد..

اهمیت این تحقیق به خاطر کاربرد وسیعش در اتومبیل‌های هوشمند تا اعضای مصنوعی بینایی برای نابینایان است. ادعا می‌شود نمونه‌های محاسبه‌ای جدید پیشرفت‌های ظاهراً مؤثری داشته است به‌گونه‌ای که موفقیت در طبقه‌بندی 60 درصد از مجموعه‌های تصاویر عکاسی معمولی را نشان می‌دهد. این آزمون بر روی پایگاه داده‌ی وسیع و کاربردی «پالتک 101» (Paltech101) انجام شده است و بدین ترتیب الگوریتم‌های بینایی کامپیوتر در برابر گستره‌ای از عکس‌ها آزموده شده است که در جهان واقعی دیده می‌شود.

اگرچه، «جیمز دی‌کارلو» (James DIcarlo) عصب‌شناسی در مؤسسه‌ی «مک‌گاورن» (McGovern) برای پژوهش‌های مغزی در «ام‌آی‌تی» (MIT)، «نیکولاس پینتو» (Nicolas Pinto) و «دیوید کاکس» (David Cox) دانشجوی دوره‌ی تحصیلات تکمیلی از مؤسسه‌ی «رولند» (Rowland) دانشگاه «هاروارد» (Harvard) به این نتیجه رسیده‌اند که این مجموعه از عکس‌ها دارای عکس‌هایی بوده‌اند که نواقصی داشتند که کامپیوترها قادر نبودند به‌طور موفقیت‌آمیزی آن‌ها را تشخیص دهند به‌خاطر این‌که با تصاویر بسیار متنوعی مواجه می‌شود به عنوان مثال، عکاس‌ها تمایل دارند اشیاء در مرکز یک قاب عکس قرار گیرد و یا این‌که زمینه‌ها و چشم‌اندازهای خاصی را ترجیح می‌دهند. این سیستم بینایی، با اشیایی در موقعیت‌هایی بسیار وسیع مواجه می‌شوند. بنابراین سیستم بینایی به‌طور متضاد با اشیاء در شرایط بسیار متفاوتی مواجه می‌شوند.

«دی‌کارلو» (DiCarlo) سرپرست گروه پژوهشی توضیح داد: تشخیص تصاویری که به راحتی توسط ما انجام می‌شود توسط کامپیوتر به سختی صورت می‌گیرد. مشکل اصلی، تنوع تصویرها است. هر شی مشخصی بر حسب زمینه‌، شدت نور، جهت، فاصله و موقعیتش، بی‌نهایت تصویر بر روی شبکیه ایجاد می‌کند.

در آزمایش‌ تشخیص اشیا توسط کامپیوتر گروه پژوهشی متوجه‌ی نواقصی شد. این امر توسط یک اسباب‌بازی مدل رایانه‌ای با الهام از اولین مراحل مسیر بینایی در مغز انجام شد. نرون‌های عصبی مصنوعی با ویژگی‌هایی شبیه به «کورتکس‌های» (Cortex) بینایی اولیه‌ی مغز هر نقطه از تصویر را تجزیه و تحلیل کرده و اطلاعات سطح پایین درباره‌ی موقعیت و جهت خطوط مرزی آن‌را ضبط می‌نماید. این مدل فاقد تجزیه و تحلیل پیچیده‌ای است که در مراحل بعد فرایند بینایی برای استخراج اطلاعات سطح بالاتر به‌وقوع می‌پیوندد. این اطلاعات سطح بالاتر شامل صحنه‌های بینایی شامل شکل، سطح و فضای بین اشیاء می‌باشد.

محققان این مدل را به‌عنوان یک «آدم پوشالی» (Strow Man) معرفی کرده‌اند و انتظار دارند تا با این شکست اولیه، راه را برای موفقیت‌های بعدی باز کنند. موقعی‌که آن‌ها این سیستم را روی تصویرهای «کالتک 101» (Caltech101) آزمایش کردند، مدل به‌طور شکفت‌انگیزی خوب و با عملکردی شبیه یا بهتر از «سیستم‌های تشخیص اشیای پنج‌مرحله‌ای» (Five State of the Art Objects Recognition) کار کرد.

«پیتنو» (Pinto) توضیح داد: این سیستم چگونه خواهد بود؟ فکر کردیم که تصویرهای طبیعی فرضی در آزمون‌های بینایی کامپیوتری واقعاً مسأله‌ی اصلی نخواهد بود و چگونگی فرایند تشخیص، «آسان» یا «سخت» ناصحیح است.

در آزمایش این تفکر، محققان یک آزمایش با دقیق و کنترل شده‌ای را طراحی کردند. با استفاده از تنها دو نوع صفحه و اتومبیل تنوع موقعیت، اندازه و جهت را برای انعکاس بهتر دامنه‌ی متنوعی از دنیای واقعی فراهم کردند.

«کاکس» (COX) می‌گوید: تنها با آزمون تشخیص دو نوع شی این آزمون برای اسباب‌بازی مدل کامپیوتری باید ساده‌تر باشد اما نشان داد که سخت‌تر است بدین ترتیب گروه پژوهشی مذکور چنین نتیجه گرفتند: «مدل ما بر روی مجموعه‌ی عکس‌های «کالتک» خوب عکل کرد اما این نتیجه به‌خاطر این نیست که مدل ما مدل خئبی بوده است بلکه به‌این دلیل بوده است که تصویرها دردنیای واقعی نیاز به ضبط تنوع دنیای واقعی ندارد.

در نتیجه، محققان برای توجیح تصاویر و استانداردهای موجود به بحث و بررسی آن‌ها پرداختند که توسط مجموعه‌ی بینایی کامپیوتر برای مقایسه‌ی توسعه‌ی مدل‌ها و اندازه‌ها به‌کار می‌رود. آن‌ها می‌گویند: قبل از این‌که کامپیوترها بتوانند به توان مغز انسان نزدیک بشوند، محققان باید بهتر بفهمند که چرا وظیفه‌ی بازشناسی اشیا هنوز مشکل است و توانایی‌های مغز هم‌چنان با عظمت هستند.

منبع خبر : سرويس فعالیت‌های علمی رشد

بازگشت

سرویس‌های رشد:

فهرست: