• Increase font size
  • Default font size
  • Decrease font size
  • default color
  • cyan color
  • red color

Persian OCR Resources

Some OCR Resources For Persian / Farsi Language

تنظیمات

موتور بازشناسی چیست؟

موتور بازشناسی یک ماژول نرم افزاری است که با استفاده از تکنیکهای بازشناسی الگو قابلیت شناسایی الگوهای خاص را دارد. به عنوان مثال یک موتور بازشناسی ارقام دستنویس فارسی قادر است با دریافت تصویر یک رقم، آن را شناسایی کرده و کد متناظرش را برگرداند. مهمترین پارامتر یک موتور بازشناسی، دقت یا نرخ بازشناسی صحیح آن است. نرخ بازشناسی بیانگر این است که چند درصد نمونه های دریافتی توسط موتور بازشناسی به درستی شناخته شده اند؛ به عنوان مثال نرخ بازشناسی 96% بیانگر این است که موتور بازشناسی به طور متوسط قادر است از هر 100 نمونه دریافتی، 96 تای آنها را به درستی بازشناسی کند و 4 نمونه را اشتباه تشخیص می دهد.

موتورهای بازشناسی عمدتا بر دو نوعند: ساختاری و هوشمند. موتورهای ساختاری با استفاده از یک سری قوانین ساختاری به بازشناسی الگوها می‌پردازند؛ مثلا رقم ٣ سه دندانه و یک خط تقریبا عمودی در انتهای خود دارد یا رقم ٥ یک شکل تقریبا دایروی است و یا رقم ٧ شامل دو خط مورب است که یک زاویه تقریبا 40 درجه تشکیل می‌دهند و قوانینی از این دست.

از سوی دیگر موتورهای بازشناسی هوشمند ابتدا بر اساس مشاهداتی که با آن فرایند آموزش گوییم، نمونه هایی را یاد می‌گیرند و سپس برای بازشناسی نمونه های جدید از آموخته های خود کمک می گیرند (تعمیم). تقریبا فرایندی شبیه به آنچه انسان انجام می دهد. همه ما الفبا را در دبستان با چند قلم تایپی آموخته‌ایم لیکن قادریم هر خط جدیدی را بخوانیم. در واقع قدرت تعمیم ما زیاد است. موتورهای بازشناسی هوشمند طی فرایند آموزش حجم زیادی از داده ها را مشاهده کرده و بر مبنای آن یک سری پارامترها را به روز می کنند؛ هر چه تعداد و تنوع این داده های بیشتر باشد قدرت تعمیم نهایی موتور بیشتر خواهد بود. به این داده ها، داده های آموزش می گوییم. امروزه روشهای متعددی برای تولید موتورهای بازشناسی هوشمند توسعه یافته است که مهمترین آنها عبارتند از شبکه های عصبی (Neural Netwroks)، ماشینهای بردار پشتیبان (Support Vector Machines)، مدلهای مخفی مارکوف (Hidden Markov Models) و توابع شعاعی پایه (Radial Basis Functions).

نرخ بازشناسی موتورها بر اساس نمونه های آموزش بیان نمی شود و غالبا روی مجموعه نمونه های جدیدی آزمایش می شوند که به آنها نمونه های آزمایش یا تست گوییم. بر این اساس ممکن است یک موتور بازشناسی به نرخ 100% روی نمونه های آموزش برسد ولی روی نمونه های آزمایش 95% جواب بدهد. در اینجا نرخ بازشناسی 95% ملاک قرار خواهد گرفت؛ واضح است که قدرت تعمیم این موتور چندان خوب نیست!

اگر شما به دنبال موتورهای بازشناسی قدرتمند برای کاربردهای خاص هستید با ما تماس بگیرید.