پژوهشکده پردازش هوشمند علائم

Get Adobe Flash player

فارس‌دات تلفنی (TFarsDat)

دادگان گفتاری تلفنی استاندارد برای زبان فارسی

1- هدف:

یکی از مهم‌ترین ابزارها برای طراحی و ساخت سیستم‌های هوشمند شناسایی گفتار، تهیه دادگان گفتاری برای آموزش مدل‌های آکوستیکی صداها و آواهای تشکیل‌دهنده یک زبان است. برای تعلیم صداها و آواهای تشکیل‌دهنده یک زبان، تعداد بسیاری زیادی نمونه از این آواها که توسط گویندگان مختلف ادا شده است، باید توسط انسان و به صورت دستی و با دقت میلی‌ثانیه از گفتار آن ها استخراج شود. تهیه این دادگان برای کانال ارتباطی تلفن، از اهمیت ویژه­ای برخوردار است.

2- چکیده:

دادگان فارس‌دات تلفنی کوچک (TFarsDat)، مجموعه‌ای از عبارات و جملات است که توسط گویندگان فارسی‌زبان از مناطق مختلف کشور از طریق خط تلفن بیان شده است. این دادگان در سطح واج (آوا) با دقت میلی‌ثانیه تقطیع و برچسب‌دهی شده و بصورت فایل‌های مجزا ذخیره گردیده است. بدون تهیه این دادگان، شروع تحقیقات وسیع و گسترده در زمینه بازشناسی گفتار پیوسته فارسی با دایره لغات بزرگ

(LVCSR) بر روی خط تلفن در دانشگاه‌های تراز اول و مراکز تحقیقاتی کشور میسر نبوده است. در زبان فارسی، دادگانی با تنوع، وسعت و کیفیت برچسب‌زنیِ دادگان فارس‌دات تلفنی وجود ندارد. البته این مهم با تلاش و کوشش مجموعه‌ای از محققین دانشگاه‌های برتر کشور میسر گردیده که اولین و مهم‌ترین گام را در شناسایی گفتار پیوسته تلفنی در زبان فارسی برداشته‌اند.

3- قابلیت‌ها:

دادگان فارس‌دات تلفنی دارای ويژگیها و قابلیت‌های زیر است:

1-انتخاب 64 گوینده بر حسب جنسیت، سن، میزان تحصیلات و لهجه از نقاط مختلف کشور.

2-پوشش 10 لهجه رایج فارسی در کشور (تهرانی، ترکی، اصفهانی، جنوبی، شمالی، خراسانی، بلوچی، کردی، لری و یزدی).

3-بیان گفتار عامیانه و محاوره­ای تلفنی (Conversational Telephone Speech) توسط هر گوینده.

4-بیان 2 جمله فارسی ثابت توسط همه گویندگان که محتوی تمامی واجهای زبان فارسی است.

5-بیان اعداد اصلی صفر تا بیست، سی، چهل، ... ، بیان روزهای هفته، ماه­های سال، حروف الفباء و نیز سیلاب­های CV توسط تمامی گویندگان از طریق خط تلفن.

6- تهیه برچسب کلمه­ای و نیز تقطیع دستی و دقیق جملات به آواهای تشکیل‌دهنده آنها و تهیه برچسب‌های واجی و آوایی برای آن و نیز

برچسب انواع صداهای موجود بر روی خط تلفن.

7-ضبط جملات با فرکانس 11025 Hz.

8-تهیه نرم‌افزار مخصوص استفاده از دادگان فارس‌دات تلفنی به منظور استفاده آسان‌تر توسط کاربران.

9-استفاده از نشانه‌گذاری بین‌المللی IPA برای برچسب‌زنی آواها و واج‌های زبان فارسی.

10-دارای مقاله مرجع چاپ شده در کنفرانس EuroSpeech’2003 و قابل ارجاع برای پژوهشگران.

11-اولین و تنها دادگان برچسب‌دار در سطح آوا برای بازشناسی گفتار پیوسته تلفنی فارسی در کشور.

4- مشخصات فنی:

- سازگاری برنامه استفاده از فارس‌دات با سیستم عامل Windows.

5- کاربردها:

1- استفاده در طراحی و ساخت سیستم‌های هوشمند تشخیص گفتار تلفنی (تبدیل گفتار به متن فارسی) و تعیین هویت گوینده بر روی خط تلفن.

2- استفاده برای کاربردهای پژوهشی و دانشگاهی در تمامی مراکز و دانشگاه‌های فعال در زمینه پردازش گفتار تلفنی.

3- استفاده در دانشکده‌های فنی-مهندسی و نیز دانشکده‌های زبان‌شناسی به عنوان دادگان استاندارد تلفنی.

مشاهده کاتالوگ محصول