پژوهشکده پردازش هوشمند علائم

Get Adobe Flash player

پروژه هاي انجام شده در گروه پردازش صوت، گفتار و زبان طبيعی

1- بازشناسي گفتار فارسي ( Speech Recognition )

1-1

بازشناسي كلمات متّصل "نرم افزار شنوا 1و2" ( Connected Word Recognition)

1-2

بازشناسي گفتار پيوسته (Continuous Speech Recognition ) " نرم افزار شنوا 3 "

1-3

بازشناسي گفتار تلفني ( Telephone Speech Recognition )

1-4

بازشناسی فرمان هاي صوتي ( Voice Commands )

1-5

سيستم جستجوگر كلمات كليدی تلفني (Keyword Spotting)

1-6

بهبود بازشناسي واج‌هاي گفتار فارسي جهت افزايش كيفيت سيستم بازشناسي كلمات كليدی تلفني

2- بازشناسي گوينده ( Speaker Recognition )

2-1

بازشناسي گوينده مستقل از متن براي گفتار مستقيم
(Text-Independent Speaker Recognition )

2-2

بازشناسي گوينده مستقل از متن براي گفتار تلفني 
(Text-Independent Speaker Recognition for Telephone Speech )

2-3

بازشناسي گوينده وابسته به متن، تعيين هويت و تصديق هويت 
(Text-Dependent Speaker Identification and Verification )

2-4

بازشناسي گوينده مستقل از متن بصورت مجموعه-باز برای کدکننده‌های با نرخ بیت پایین (Text-Independent Open-Set Speaker Identification )

3- بهبود كيفيت گفتار ( Speech Enhancement )

3-1

بهبود كيفيّت گفتار به روش تفريق طيفي ( Spectral Subtraction )

3-2

بهبود كيفيّت گفتار به روش جداسازي سيگنال‌ها ( Signal Separation )

3-3

بهسازي گفتار با استفاده از شبكه‌هاي عصبي مصنوعي

3-4

امكان‌سنجي بهسازي گفتار با هدف افزايش قابليت فهم گفتار

3-5

بهبود كيفيّت گفتار با سيستم چندميکروفنی (Multi-Microphone)

4- تهيه انواع دادگان گفتاري (Speech Databases )

4-1

دادگان گفتار مستقيم زبان فارسي " فارس‌دات" (Farsi Spoken Language Database )

4-2

دادگان گفتار تلفني زبان فارسي " فارس‌دات تلفني " (محاوره‌ای و مونولوگ) 
( Farsi Telephone Speech Database)

4-3

دادگان بزرگ گفتار مستقيم زبان فارسي " فارس‌دات بزرگ مستقيم "

4-4

دادگان بزرگ گفتار تلفني زبان فارسي " فارس‌دات بزرگ تلفني "( محاوره‌ای و ديالوگ)

4-5

دادگان اعداد و ارقام منفصل و پيوستة فارسي

4-6

دادگان گفتار چند زبانه ( Multi-Lingual Speech Database)

4-7

دادگان گفتار نويزي ( Noisy Spoken Language Database )

4-8

بازسازي گفتار فارسي (Farsi Speech Synthesis )

4-9

واژگان زاياي زبان فارسي

4-10

دادگان صوتي هجاهاي زبان فارسي

5

نرم‌افزار تبديل متن به گفتار فارسي برای نابينايان (پروژه صفحه خوان شيوا)

6

بازشناسي خودكار زبان (Spoken Language Identification )

7

بسته نرم‌افزاري تفكيك زبان فارسي گفتاري از زبان‌هاي ديگر

8

تشخيص كلمات خاص در گفتار پيوسته (مستقيم و تلفني) فارسي
(Farsi Keyword Spotting)

9

مدلسازي زبان فارسي (Farsi Language Modeling )

10

پيكره متني زبان فارسي (Farsi Electronic Text Corpus )

11

استخراج الگوهاي لحن گفتار فارسي (Farsi Speech Prosody )

12

سيستم كنترل دسترسي صوتي (نرم‌افزار و سخت‌افزار)

13

نرم‌افزار پنهان‌سازي اطلاعات در پژواك‌هاي نامحسوس صوتي

14

كدكننده صوتي با نرخ بيت خيلي پائين (وكودر واجي bps300)

15

دسته‌بندي موضوعي متون فارسي

16

تبديل نرم‌افزار و بانك اطلاعاتي طرح واژگان زايا از محيط ويندوز به متن باز( Opeon Sorce )

17

ارتقاي كيفيت گفتار بازسازي شده در سيستم تبديل متن به گفتار فارسي ( گويا )

18

بازشناسي گوينده روي VoIP

19

توسع و تكميل سيستم پنهان‌سازي اطلاعات در پژواك‌هاي نامحسوس

20

بهبود كيفيت گفتار نويزي با استفاده از شبكه‌هاي عصبي