نرمافزار تقلید صدا به همت فارغالتحصیلان کارشناسی ارشد دانشکدهی مهندسی پزشکی دانشگاه «صنعتی امیرکبیر» طراحی و تدوین شد.
به گزارش ایسنا، «بهروز مکی»، مجری طرح گفت: تبدیل گوینده با استفاده از شبکههای عصبی غیر خطی یعنی صدای فرد ضبط میشود و با تغییراتی که بر روی آن اعمال میشود به نظر میرسد که فرد دیگری صحبت کرده و صدا به نوعی تغییر میکند.
«مکی» یادآور شد: این نرم افزار در سیستمهای تبدیل متن به گفتار استفاده میشود و به علت اینکه سطح پردازش آنها خیلی زیاد است، معمولاً صدای ضبط شده را با این نرم افزار تغییر داده و تبدیل به صدای فرد دیگری میکنند.
مجری طرح گفت: این نرم افزار به بهبود صدای کسانی که مشکل گویش دارند کمک کرده و گرفتگی صدا و غیره را رفع میکند.
به گفتهی این دانشآموختهی دانشگاه «صنعتی امیرکبیر»، از این روش میتوان در کارهایی که با اینترنت مرتبط میشود استفاده کرد. مثلاً میتوان ایمیل را با صدای فرستنده شنید.
وی گفت: دراین روش صدا ضبط میشود. پارامترهای مخصوصی از آن استخراج شده و بعد پارامترها به شبکه ارسال میشود و با استفاده از شبکههای عصبی غیر خطی پارامترها تبدیل شده و به فضای سیگنال بر میگردانیم و سپس با انجام یکسری فعالیتهای جزیی کیفیت صدا بهبود مییابد.
«مکی» در پایان افزود: چون شبکههای عصبی یک سیستم پیوسته است تا حدودی این قابلیت را دارد که بخشی از خرابی سیگنال را دوباره ترمیم کند.
|