بهگزارش خبرگزاری دانشجویان ایران (ایسنا)، «آرش محمدی» فارغالتحصیل کارشناسی ارشد و مجری طرح گفت: «سیستمهای خودکار بازشناسی گفتار» امروزه کاربردهای زیادی در محیطهای واقعی و شرایط عملی پیدا کردهاند و این لزوم بهبود عملکرد این سیستمها را در محیطهای واقعی ایجاد میکند.
وی هدف از اجرای این پروژه را بازسازی و مقاومسازی گفتار از دست رفته بر اثر نویز در محیطهای واقعی ذکر کرد و گفت: در روشهایی که تاکنون وجود داشته اغلب تلاش بر این بوده که متغیرهای طیفی و آمار نویز بهگونهای تخمین زده شده و از این طریق نویز از روی گفتار سیگنال حذف و بازشناسی را بهبود داده شود.
«محمدی» خاطرنشان کرد: از سال 1379 تا 1384 (2000 تا 2005 میلادی) یکسری روشهای جایگزین برپایهی افزونگی اطلاعات در سیگنال گفتار ارائه شد. در این روشها با توجه به این نکته که نویز بهصورت محلی در حوزهی فرکانس عمل میکند و تنها بعضی از قسمتهای سیگنال را تخریب مینماید بازشناسی تنها بهوسیلهی گفتار باقیمانده و بازسازی گفتار از دست رفته بهبود داده میشود.
بهگفتهی وی، در این پژوهش اطلاعات گفتار حذف شده با توجه به افزونگی اطلاعاتی در قسمتهای موجود بازسازی میشود که کار بر روی دادگان فارسی و انگلیسی انجام شد.
مجری طرح در ادامه خاطرنشان کرد: جهت بازسازی پس از پیادهسازی الگوریتمهای پیشنهادی در کارهای پیشین سه ایدهی جدید ارائه شد که شامل استفاده از خوشهبندی آوایی جهت بهبود روش خوشهبندی معمولی، مدلسازی بردارهای طیفی با استفاده از توزیع لاپلاس و تخمین ویژگیهای از دست رفته و در نهایت بهرهگیری از همبستگیهای زمانی جهت بازسازی اسپکتروگرام ناقص با استفاده از کالمن فیلتر میباشد..