پژوهشکده پردازش هوشمند علائم

Get Adobe Flash player

هدف:

آناليز قالب‌بندي اسناد که يکي از زيرشاخه هاي آناليز و درک تصاوير مي‌باشد با هدف تعيين بخش‌هاي مختلف در يک صفحه مانند متن، جدول، عکس و اطلاعات تکميلي نظير کلمه، خط، پاراگراف و تعداد سطر و ستون جدول و محتواي سلول‌هاي جدول انجام مي‌شود.به‌دليل تفاوت‌هايي که در ساختار خط فارسي، پاراگراف‌ها و صفحه‌بندي متون نسبت به انگليسي وجود دارد، آناليز قالب‌بندي براي تصاوير اسناد فارسي ضروري است و نسخه‌هاي خارجي براي فارسي عملکرد خوبي ندارند.این پروژه با هدف ارائه نرم افزاری بهینه با توانایی بالا در تعيين محدوده تصاوير به صورت مستطيل يا چند ضلعي در يك صفحه، تشخيص محدوده متون در حد خط و پاراگراف و همچنين تعيين تعداد ستون در يك صفحه، شماره گذاري تصاوير و جداول پاراگراف­ها و خطوط درون پاراگراف­ها از بالا به پايين و از راست به چپ وتعيين محدوده جداول با خط و بدون خط با تعيين متن هر سلول ( انگليسي يا فارسي ) و محدوده هر سلول و تعداد سطر و ستون انجام شده است.

محصول:

نرم افزار تمایز

قابليت‌ها:

· تشخيص کلمه, خط و پاراگراف و شماره‌گذاري آنها به ترتيب

· تعيين مرز عکس‌ها به شکل مستطيل يا چند ضلعي

· تعيين مرز جداول, تشخيص تعداد سطر و ستون و محتواي هر سلول جدول

· تشخيص چرخش يا skew

· تشخيص جهت صفحه يا Page Orientation

· تشخيص قالب‌بندي براي متون ترکيبي فارسي و انگليسي

· پردازش سريع

· تعيين پاراگراف‌ها بر مبناي ساختار متن فارسي و انگليسي

· عملکرد فوق‌العاده، در محدودة بزرگي از رزولوشن‌ها, کيفيت‌ها و ابعاد

· عدم نياز به تنظيم پارامتر، به‌صورت كاملاً خودکار

· مهيا بودن شرايط براي تعيين Header، Footer و Logo

· عملکرد سريع‌تر براي تصاوير با کيفيت مطلوب

· امکان تعريف Template براي آناليز تصاوير با قالب‌بندي‌هاي خاص

 

 

مشخصات فني:

· پياده‌سازي شده با ++C

· قابل اجرا بر روي نسخه‌هاي مختلف XP و Vista

· داراي قفل سخت‌افزاري

 

كاربردها:

· نويسه‌خوان فارسي

· تشخيص ميزان متن در يک تصوير

· پيش‌پردازش لازم براي کاربردهاي متنوع ديگر مثل تعيين زبان و فونت

· آناليز پايگاه‌هاي تصويري بر مبناي محتوا