۲۰۰ صفحه از ۲۰۰ کتاب


مجموعه داده‌ای شامل ۲۰۰ صفحه از ۲۰۰ کتاب توسط استاد ارجمند جناب آقای دکتر کبیــر جهت انتشار در اختیار سایت farsiocr.ir قرار گرفت.

این مجموعه شامل ۲۰۰ صفحه متنی از ۲۰۰ کتاب مختلف است که با درجه تفکیک ۳۰۰ نقطه بر اینچ و به صورت باینری روبش (اسکن) شده است. از این مجموعه می توان برای کاربردهایی مثل ارزیابی الگوریتمهای فشرده سازی تصاویر متنی و ارزیابی الگوریتمهای شناسایی متون فارسی استفاده کرد.

دو نمونه از تصاویر این مجموعه در انتهای این صفحه آمده است. علاقه مندان می‌توانند جهت دانلود این تصاویر از پیوندهای زیر استفاده کنند.

دانلود بخش اول شامل ۱۰۰ صفحه اول
دانلود بخش دوم شامل ۱۰۰ صفحه دوم

مجموعه تصاویر متنی فارسی با درجه تفکیک 300 مجموعه تصاویر متنی فارسی با درجه تفکیک 300

 

۴ دیدگاه

  1. سلام
    فایل‌هایی رو که گذاشتید، دریافت کردم، ولی متن مرتبط به تصاویر رو در این فایل‌ها نمی‌بینم. برای ارزیابی روش‌های ocr علاوه بر خود تصاویر به متن مرتبط با اونها هم نیاز هست.

    پاسخ به دیدگاه

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *