این سایت با هدف دسترسی آسان به منابع مرتبط با OCR فارسی راه اندازی شده است. در اینجا شما می توانید منابع رایگان مثل مجموعه داده های ارقام و حروف دستنویس و قلمهای فارسی را دریافت کنید. همین طور منابع تجاری مانند کتابخانه تشخیص پلاک خودرو، سامانه نویسه خوان فارسی و موتورهای بازشناسی سفارشی هم در این سایت قابل تهیه هستند.

پیوندهای مفید:
مجموعه ارقام دستنویس فارسی
مجموعه حروف دستنویس فارسی
نویسه خوان پرشیانگار (نگارش ۱٫۵)
سامانه تشخیص پلاک خودرو (نگارش  ۴٫۱ با امکان تشخیص پلاک جانبازان و معلولین)

کتابخانه شناسایی ارقام و حروف دستنویس فارسی و اطلاعات پاسپورت
کتابخانه Pattern Classifier – تشخیص الگو با شبکه عصبی

رفع خطای حافظه و بسته شدن پرشیانگار

مشکل بسته شدن ناگهانی پرشیانگار ۱٫۵، که ناشی از فرایند حفاظت کد بود، با تغییر مکانیسم فعالسازی نرم افزار برطرف شده است. با این تغییر، مشکلی که برخی آنتی ویروسها هم با نرم افزار داشتند، مرتفع شده است. مشتریانی که نسخه نقره ای ۱٫۵ را قبلا تهیه کرده اند و با این مشکل روبرو شده اند، جهت دریافت نسخه رفع باگ شده، می توانند از طریق ایمیل تماس بگیرند و با ذکر شماره سریال نرم افزار، نسخه جدید را دریافت کنند.

آی پلاک – iPelak سامانه کامل تشخیص پلاک

بنا به تقاضای عده زیادی از مشتریان کتابخانه تشخیص پلاک ستپا طراحی یک سامانه ی نرم افزاری با رابط کاربری مناسب و قابلیت اتصال به انواع دوربینهای تحت شبکه و دیجیتال و آنالوگ را شروع کرده ایم و انشاءالله به زودی به بهره برداری خواهد رسید. متقاضیان عزیز می توانند مشخصات مورد نیازشان را در نظرات این پست یا از طریق ایمیل به اطلاع ما برسانند. این سامانه احتمالا در دو نسخه‌ی مناسب برای پارکینگها و مناسب برای کنترل ترافیک ساخته خواهد شد.

سامانه طوری طراحی شده است که تنها زمانی که خودرویی در تصویر ظاهر شود شروع به پردازش به منظور یافتن پلاک می کند و از این نظر حجم پردازشی کمی از CPU را مصرف می کند.

آی پلاک، سامانه پلاک خوان پارکینگ و اتوبان

نگارش ۱٫۵ پرشیانگار

نسخه ۱٫۵ نویسه خوان پرشیانگار منتشر شد. مهمترین تغییر این نسخه، اضافه شدن قالب خروجی word است. به این ترتیب که در فایل خروجی شما می توانید تصاویر را هم در کنار متن داشته باشید. علاوه بر این، رابط کاربری کمی بهبود پیدا کرده است و برخی باگهای نرم افزار رفع شده است. برای کسب اطلاع از قیمت و نحوه خرید به صفحه سفارش پرشیانگار مراجعه کنید.

Persia-Negar-Farsi-OCR-Silver-1.5

کتابخانه تشخیص پلاک خودرو به زبان ++C

ستپا سامانه تشخیص پلاک خودروهای ایرانی است که به زبان ++C نوشته شده است. در این سامانه از تکنیکهای پردازش تصویر و شناسایی الگو کمک گرفته شده و با دقت بسیار زیاد، موقعیت پلاک و حروف پلاک شناسایی می‌شود. این سامانه در قالب یک کتابخانه قابل استفاده در زبانهای C++ ، C، دلفی و #C است. برای برخی پردازشهای مقدماتی از قابلیتهای ساده OpenCV هم کمک گرفته شده است لیکن بخش عمده برنامه مستقل از OpenCV است.

تشخیص خودکار پلاک ایرانی (فارسی) ANPR

برای کسب اطلاعات بیشتر، و دانلود برنامه نمونه، لینک زیر را باز کنید.
کتابخانه تشخیص پلاک خودرو به زبان C++ به همراه سورس کد

کتابخانه شناسایی ارقام، حروف دستنویس و پاسپورت

بازشناسی ارقام و حروف دستنویس فارسی، موضوعی است که سالهاست روی آن کار می شود؛ چه در حوزه تحقیقات دانشگاهی و چه در حوزه های تجاری و کاربردی. مقالات و پایان نامه های متعددی در این زمینه ها ارائه شده است و البته کارهای صنعتی زیادی هم صورت گرفته است.

از مهمترین کاربردهای شناسایی ارقام و حروف دستنویس، پردازش فرمهای ورود اطلاعات است. مثلا فرمهای بانکی، فرمهای ثبت نام در موسسات مختلف، فرمهای پاسخنامه آزمونهای سراسری و المپیادها یا فرمهای دریافت وام! در اکثر این فرمها، اطلاعات دستنویس مهم مانند نام و نام خانوادگی و شماره دانشجویی یا کد ملی و امثال اینها در فیلدهای مخصوصی وارد می شوند که بعدا پردازش آنها آسانتر صورت گیرد. البته ناگفته پیداست که در بسیاری از سازمانهای ما هنوز پردازش خودکار فرم صورت نمی گیرد و همچنان کاربر انسانی است که اطلاعات را می خواند و وارد کامپیوتر می کند و اگر بدانیم که سالانه چند صد میلیون و یا شاید چندین میلیارد فرم توسط کاربر انسانی داده آمایی می شود، به اهمیت پردازش خودکار فرم پی خواهیم برد.

نمونه ای از فرمهای ورود اطلاعات ادامه‌ی خواندن

موتور بازشناسی چیست؟

موتور بازشناسی یک ماژول نرم افزاری است که با استفاده از تکنیکهای بازشناسی الگو قابلیت شناسایی الگوهای خاص را دارد. به عنوان مثال یک موتور بازشناسی ارقام دستنویس فارسی قادر است با دریافت تصویر یک رقم، آن را شناسایی کرده و کد متناظرش را برگرداند. مهمترین پارامتر یک موتور بازشناسی، دقت یا نرخ بازشناسی صحیح آن است. نرخ بازشناسی بیانگر این است که چند درصد نمونه های دریافتی توسط موتور بازشناسی به درستی شناخته شده اند؛ به عنوان مثال نرخ بازشناسی ۹۶% بیانگر این است که موتور بازشناسی به طور متوسط قادر است از هر ۱۰۰ نمونه دریافتی، ۹۶ تای آنها را به درستی بازشناسی کند و ۴ نمونه را اشتباه تشخیص می دهد.

موتورهای بازشناسی عمدتا بر دو نوعند: ساختاری و هوشمند. موتورهای ساختاری با استفاده از یک سری قوانین ساختاری به بازشناسی الگوها می‌پردازند؛ مثلا رقم ٣ سه دندانه و یک خط تقریبا عمودی در انتهای خود دارد یا رقم ۵ یک شکل تقریبا دایروی است و یا رقم ٧ شامل دو خط مورب است که یک زاویه تقریبا ۴۰ درجه تشکیل می‌دهند و قوانینی از این دست… ادامه‌ی خواندن

اصطلاحات پایه ای OCR

در دنیای بازشناسی متون اصطلاحات مختلفی استفاده می شود که هرچند برای اهل فن آشناست، لیکن اکثریت مردم از تعریف دقیق آنها بی اطلاعند. در این مقاله به تعریف سه اصطلاح متداول OMR، ICR و OCR می پردازیم.

sample omr form - یک فرم نمونه چند گزینه ای

۱٫ OMR چیست؟

OMR که مخفف کلمات Optical Mark Reader/Recognition است به معنی خواندن نوری مارک بوده و عمدتا در آزمونهای چند گزینه ای استفاده می شود. به این ترتیب که فرمهای خاصی طراحی شده و آزمون دهندگان مارکهای (غالبا بیضی شکل یا مستطیل) مورد نظر را با قلمهای نرم پر می کنند. برای خواندن خودکار این فرمها، می توان از دستگاههای مارک خوان استفاده کرد یا از نرم افزارهای مارک خوان کمک گرفت. دستگاههای مارک خوان (OMR Scanner) نوعی روبشگر (اسکنر) ویژه اند که قادرند با استفاده از تاباندن نور به سطرهای مختلف برگه امتحان، موقعیت مارکهای پرشده را تشخیص دهند. این دستگاهها مقادیر آستانه ای برای یافتن مواردی که چند گزینه پر شده است و یا هیچ گزینه ای پر نشده است، دارند.

نرم افزارهای OMR در واقع کار دستگاهها را شبیه سازی می کنند؛ به این ترتیب که تصویر اسکن شده را دریافت کرده و با پردازش آن موقعیت مارکهای مختلف را در می یابند. به دلیل سهولت پردازش اطلاعات، این تکنولوژی همچنان در بسیاری از آزمونهای روز دنیا مورد استفاده است و در کشور ما نیز شرکتهای زیادی در این زمینه کار می کنند. ادامه‌ی خواندن