زهرا امینی؛ ندا فرجی
چکیده
بیشتر روشهای بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه میدهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد میشود که در آن از یک توزیع دنباله ...
بیشتر
بیشتر روشهای بهسازی گفتار، تخمینگری کاملاً متکی به مدل تصادفی گفتار ارائه میدهند. در این مقاله، یک تخمینگر کمترین میانگین مربعات خطا تحت یک مدل قطعی - تصادفی پیشنهاد میشود که در آن از یک توزیع دنباله - سنگین به نام(tls) t location-scale برای مدلکردن ضرایب تبدیل فوریه گسسته گفتار تمیز و از مدل نمایی و سینوسی بهعنوان مدل قطعی استفاده شده است. در مدل نمایی بهکاررفته، تخمین فرکانس و ضریب میرایی به روش ماتریس پِنسِل انجام میشود. همچنین، در پژوهشهای قبلی تعداد مؤلفههای نمایی در ساخت مدل قطعی برای بهسازی گفتار، یک در نظر گرفته شده است که در این مقاله، مدل نمایی به تعداد دلخواه مؤلفههای نمایی بسط داده میشود. پیادهسازیها در سه حالت ترکیبی نمایی - گاوسی (روش پیشنهادی نخست)، نمایی - tls (روش پیشنهادی دوم) و سینوسی - گاوسی انجام شدهاند و با روش موجود نمایی – گاوسی (تنها با یک مؤلفة نمایی) و تخمینگرهای تصادفی وینر و مبتنی بر tls مقایسه میشوند. نتایج پیادهسازی در حضور شش نویز از مجموعه دادة نویز noisex-92 نشان میدهند که دو روش پیشنهادی در قیاس با روشهای مبتنی بر مدل تصادفی صرف، به بهبود معیار نسبت سیگنال به نویز قطعهای منجر شدهاند و در ارزیابی ادراکی کیفیت گفتار عملکرد نسبتاً برابری دارند.