پژوهشکده پردازش هوشمند علائم

Get Adobe Flash player

جويا

(سيستم آشکارساز کلمات کليدی در گفتار محاوره‌ای)

1- هدف:

يافتن کلمات و واژگان خاص در مکالمات صوتی و گفتاری (Keyword Spotting)، کاربردهای فراوانی داشته و از اهميت بسيار بالايی برخوردار است. سيستم جويا ابزاری است برای يافتن کلمات مهم و مورد نظرِ کاربر در گفتار محاوره‌ای و واقعی که از آخرين تکنيک‌های پيشرفته در پردازش گفتار بهره می‌گيرد.

2- چکيده:

در سيستم جويا، کاربر تعدادی از کلمات کليدی بسيار مهم را که Keyword ناميده می‌شود، انتخاب می‌کند. برای آموزش اين کلمات به­سيستم، نيازی به اَدا کردن و گفتن آن­ها و يا جمع‌آوری دادگان آموزشی نيست، و تنها لازم است که کاربر، کلمه­ی مورد نظر را از يک فرهنگ لغات انتخاب کند و در صورت عدم وجود کلمه در فرهنگ لغت، دنباله­ی اصوات تشکيل‌دهنده آن کلمه را در سيستم وارد کند. پس از مشخص شدن کلمات کليدی، سيستم در مکالمات محاوره‌ای صوتی جستجو می‌کند و هر جا کلمه مورد نظر را يافت، اعلام می‌کند(Alarm)و محل وقوع زمانی کلمه گفته شده را در فايل صوتی به کاربر گزارش می‌دهد.

3- قابليت‌ها:

نسخه فعلی از نرم‌افزار جویا (کاوشگر کلمات) دارای ويژگی­ها و قابلیت‌های زیر است:

  1. قابليت اضافه کردن کلمات کليدی جديد به تعداد نامحدود (Unlimited Vocabulary).
  2. قابليت اضافه کردن کلمات کليدی جديد از يک فرهنگ لغت (شامل 50.000 کلمه پرکاربرد در زبان فارسی).
  3. قابليت اضافه کردن کلمات کلیدی که در فرهنگ لغت موجود نيستند (با وارد کردن دنباله آواهای تشکیل‌دهندۀ کلمه کلیدی جدید با استفاده از یک صفحه کلید مخصوص).
  4. عدم نیاز به دادگان آموزشی برای تعریف کلمات کلیدی و یا بیان این کلمات توسط کاربر
  5. قابليت تنظيم ميزان دقّت آشکارسازی (Detection Rate) و خطای False Alarm توسط کاربر
  6. قابليت جستجوی همزمان، به دنبال تمامی کلمات کليدی تعريف شده توسط کاربر.
  7. استفاده از روش­های مقاوم برای مدل­سازی آکوستيکی و کاهش اثر نويز و کانال ارتباطی
  8. دقّت آشکارسازی (FOM) بالای 80% در آشکارسازی کلمات کلیدی در مکالمات تلفنی محاوره­ای
  9. دارای یک واسط کاربری متن­کاوی (Text Mining) برای جستجو به­صورت متنی در خروجی موتور جستجوی گفتاری
  10. ارائۀ يک عدد به کاربر برای نشان­دادن درصد اطمينان (از 0% تا 100%) در آشکارسازی کلمات (Confidence Measure).
  11. قابليت استفاده از توان محاسباتی رایانه­های چندپردازنده (Multi-Processor) با استفاده از تکنیک Multi-Threading .
  12. اولين محصول عملياتی و کاربردی با سرعت بالا و خطای پايين برای آشکارسازی کلمات در مکالمات تلفنی در کشور.

4- مشخصات فنی:

1-سازگاری با سیستم عامل  Windows 7 و  Windows XP

2- پردازنده Core i7 و بالاتر براي حالت Multi-Threading

3- 500 مگابايت حافظه­ی RAM به ازاي هر Thread

 

 

5- کاربردها:

1- پيدا کردن کلمات کليدی خاص در آرشيوهای صوتی و گفتاری (به­عنوان مثال در سازمان صدا و سيما يا ارگان‌های ديگر).

2- استفاده از جويا به­عنوان يک موتور جستجوی گفتاری (Voice Search Engine) برای يافتن کلمات و واژه‌ها در فايل‌های صوتی.

3- يافتن کلمات بسيار حساس در مکالمات صوتی برای کاربردهای امنيتی.

4- استفاده از جويا برای ارزيابی نحوه­ی تکلم کلمات خاص و امتيازدهی به افرادی که در بيان کلمات مشکلاتی دارند.

مشاهده کاتالوگ محصول