شاخص

این سایت با هدف دسترسی آسان به منابع مرتبط با OCR فارسی راه اندازی شده است. در اینجا شما می توانید  مقالات آموزشی مرتبط با OCR فارسی و منابع رایگان مثل مجموعه داده های ارقام و حروف دستنویس را دریافت کنید. همین طور منابع تجاری مانند ماژولهای تشخیص پلاک خودرو، سامانه نویسه خوان فارسی و موتورهای بازشناسی سفارشی هم در این سایت قابل تهیه هستند.

پیوندهای مفید:
مجموعه ارقام دستنویس فارسی
مجموعه حروف دستنویس فارسی
نویسه خوان پرشیانگار
سامانه تشخیص پلاک خودرو

موتور بازشناسی چیست؟

موتور بازشناسی یک ماژول نرم افزاری است که با استفاده از تکنیکهای بازشناسی الگو قابلیت شناسایی الگوهای خاص را دارد. به عنوان مثال یک موتور بازشناسی ارقام دستنویس فارسی قادر است با دریافت تصویر یک رقم، آن را شناسایی کرده و کد متناظرش را برگرداند. مهمترین پارامتر یک موتور بازشناسی، دقت یا نرخ بازشناسی صحیح آن است. نرخ بازشناسی بیانگر این است که چند درصد نمونه های دریافتی توسط موتور بازشناسی به درستی شناخته شده اند؛ به عنوان مثال نرخ بازشناسی ۹۶% بیانگر این است که موتور بازشناسی به طور متوسط قادر است از هر ۱۰۰ نمونه دریافتی، ۹۶ تای آنها را به درستی بازشناسی کند و ۴ نمونه را اشتباه تشخیص می دهد.

موتورهای بازشناسی عمدتا بر دو نوعند: ساختاری و هوشمند. موتورهای ساختاری با استفاده از یک سری قوانین ساختاری به بازشناسی الگوها می‌پردازند؛ مثلا رقم ٣ سه دندانه و یک خط تقریبا عمودی در انتهای خود دارد یا رقم ۵ یک شکل تقریبا دایروی است و یا رقم ٧ شامل دو خط مورب است که یک زاویه تقریبا ۴۰ درجه تشکیل می‌دهند و قوانینی از این دست… ادامه خواندن Continue reading

اصطلاحات پایه ای OCR

در دنیای بازشناسی متون اصطلاحات مختلفی استفاده می شود که هرچند برای اهل فن آشناست، لیکن اکثریت مردم از تعریف دقیق آنها بی اطلاعند. در این مقاله به تعریف سه اصطلاح متداول OMR، ICR و OCR می پردازیم.

sample omr form - یک فرم نمونه چند گزینه ای

۱٫ OMR چیست؟

OMR که مخفف کلمات Optical Mark Reader/Recognition است به معنی خواندن نوری مارک بوده و عمدتا در آزمونهای چند گزینه ای استفاده می شود. به این ترتیب که فرمهای خاصی طراحی شده و آزمون دهندگان مارکهای (غالبا بیضی شکل یا مستطیل) مورد نظر را با قلمهای نرم پر می کنند. برای خواندن خودکار این فرمها، می توان از دستگاههای مارک خوان استفاده کرد یا از نرم افزارهای مارک خوان کمک گرفت. دستگاههای مارک خوان (OMR Scanner) نوعی روبشگر (اسکنر) ویژه اند که قادرند با استفاده از تاباندن نور به سطرهای مختلف برگه امتحان، موقعیت مارکهای پرشده را تشخیص دهند. این دستگاهها مقادیر آستانه ای برای یافتن مواردی که چند گزینه پر شده است و یا هیچ گزینه ای پر نشده است، دارند.

نرم افزارهای OMR در واقع کار دستگاهها را شبیه سازی می کنند؛ به این ترتیب که تصویر اسکن شده را دریافت کرده و با پردازش آن موقعیت مارکهای مختلف را در می یابند. به دلیل سهولت پردازش اطلاعات، این تکنولوژی همچنان در بسیاری از آزمونهای روز دنیا مورد استفاده است و در کشور ما نیز شرکتهای زیادی در این زمینه کار می کنند. ادامه خواندن Continue reading