• Increase font size
  • Default font size
  • Decrease font size
  • default color
  • cyan color
  • red color

Persian OCR Resources

Some OCR Resources For Persian / Farsi Language

تنظیمات

مقالات مرتبط با OCR فارسی - بخش دوم

Written by Administrator   
Friday, 04 December 2009 19:35
در این بخش برخی از مقالات مرتبط با OCR فارسی را که در کنفرانس ICDAR 2009 منتشر شده اند، در اختیار پژوهشگران قرار می دهیم. برخی از این مقالات در مورد OCR ‌انگلیسی هستند لیکن روشها قابل استفاده در فارسی هم هست:

1. مقاله ای در باب شناسایی نویسنده از روی دستخط A New Method for Writer Identification of Handwritten Farsi Documents

2. روشی پویا و محلی برای باینری کردن (دوسطحی سازی) تصاویر اسناد Constant-Time Locally Optimal Adaptive Binarization

3. مقاله دیگری در زمینه دوسطحی سازی Feature Based Binarization of Document Images Degraded by Uneven Light

4. معرفی مجموعه دادگان متون دستنوشته فارسی FHT An Unconstraint Farsi Handwritten Text Database

5. مسابقه شناسایی ارقام دستنویس فارسی/عربی ICDAR 2009 Handwritten Farsi / Arabic Character Recognition Competition

6. یافتن کلمات و حروف لاتین در خطوط دارای چرخشهای نامتعارف Multi-Oriented and Multi-Sized Touching Character Segmentation using dynamic Programming

1. بازشناسی متون انگلیسی بر اساس لغات (در متنهایی که لغات قابل جداسازی نیستند)  Word-Based Adaptive OCR for Historical Books

Last Updated on Friday, 04 December 2009 20:24
 

Written by Administrator   
Friday, 16 October 2009 21:37
در این بخش برخی از مقالات مرتبط با OCR فارسی را در اختیار پژوهشگران عزیز قرار می دهیم:

1. كاربرد تطابق شكل در بازشناسی ارقام دستنویس فارسی، مجله فنی مهندسی مدرس سال 1384

2. Introducing a very large dataset of handwritten Farsi digits and a study on their varieties, Pattern Recognition Letters, 2007

3. A blackboard approach towards integrated Farsi OCR system, IJDAR, 2009

برای دیدن تمام مطالب موجود در سایت، باید ثبت نام کنید.

Last Updated on Friday, 16 October 2009 21:55
 

English Version

مجموعه ارقام دستنویس هدی که اولین مجموعه‌ی بزرگ ارقام دستنویس فارسی است، مشتمل بر 102353 نمونه دستنوشته سیاه سفید است. این مجموعه طی انجام یک پروژه‏ی کارشناسی ارشد1 درباره بازشناسی فرمهای دستنویس تهیه شده است2. داده های این مجموعه از حدود 12000 فرم ثبت نام آزمون سراسری کارشناسی ارشد سال 1384 و آزمون کاردانی پیوسته‏ی دانشگاه جامع علمی کاربردی سال 1383 استخراج شده است. خصوصیات این مجموعه داده به شرح زیر است:

درجه تفکیک نمونه‏‌ها: ۲۰۰ نقطه بر اینچ
تعداد کل نمونه‏ها: ۱۰۲۳۵۲ نمونه
تعداد نمونه‏های آموزش: ۶۰۰۰ نمونه از هر کلاس
تعداد نمونه‏های آزمایش: ۲۰۰۰ نمونه از هر کلاس
سایر نمونه‏ها: ۲۲۳۵۲ نمونه

تعداد نمونه ها در هر كلاس

رقم ٠ رقم ١ رقم ٢ رقم ٣ رقم ٤ رقم ٥ رقم ٦ رقم ٧ رقم ٨ رقم ٩
10070 10330 9923 10334 10333 10110 10254 10363 10264 10371

 

ادامه مطلب
 

مجموعه داده‌ی "ارقام مدرس"، یک مجموعه داده‌ی رایگان بوده که شامل 1699 نمونه ارقام دستنوشته به صورت فایلهای BMP سیاه سفید می باشد. این مجموعه که توسط گروه پردازش تصویر دانشکده فنی دانشگاه تربیت مدرس تولید شده برای اولین بار از طریق سایت www.FarsiOCR.ir به منظور انجام تحقیقات دانشگاهی در اختیار عموم قرار می گیرد. استفاده‌ی تجاری از این مجموعه منوط به کسب اجازه از مدیر سایت ( This e-mail address is being protected from spambots. You need JavaScript enabled to view it ) است.

تعداد نمونه ها در هر کلاس

رقم ٠ رقم ١ رقم ٢ رقم ٣ رقم ٤ رقم ٥ رقم ٦ رقم ٧ رقم ٨ رقم ٩
١٧٦ ١٧٠ ١٦٣ ١٧١ ١٧٣ ١٧٢ ١٧٤ ١٧٢ ١٦٩ ١٥٩

 

ادامه مطلب
 

ورود کاربران



حاضرین در سایت

در حال حاضر 5 مهمان حضور دارند

خوراک سایت

Farsi OCR Feed

نطرسنجی

چگونه با این سایت آشنا شدید؟