پایگاه داده جامع دستنویس برای تشخیص برون خط دستخط فارسی 

 

 

در این صفحه یک پایگاه داده دستنویس فارسی بدیع برای ارتقا پژوهش در زمینه ی تشخیص برون خط دستخط فارسی معرفی شده است. 500 نویسنده بومی فارسی زبان که به صورت مساوی 250 مرد و 250 زن به صورت تصادفی انتخاب و 7 فرح نمونه را پر کردند.در این پایگاه داده شامل تعداد عظیمی از رقم های جدا شده ی دستنویس، ارقام به هم متصل، تاریخ، کلمات، اسامی، حروف الفبایی، متن آزاد، نشانه و سمبل های ریاضی و خاص است. هر نمونه ی این پایگاه داده، شناسه ی نویسنده، جنسیت، سن، چپ دستی یا راست دستی و سطح تحصیلات هر نویسنده فراهم شده است و تمام نمونه های این پایگاه داده با صحت زمینه ی جزیی و در سه فرمت ذخیره و آماده گردیده اند: رنگی، خاکستری و سیاه سفید. همچنین تمام زیرمجموعه های این پایگاه داده به صورت تصادفی به سه دسته ی یادگیری، اعنبارسنجی و آزمون تقسیم شده اند که برای برای آزمایشات یادگیری ماشین، تشخیص الگو و پردازش تصویر آماده باشند. 


این پایگاه داده به صورت آزادنه برای جامعه ی پژوهشگر و برای اهداف پژوهشی در زمینه های یادگیری ماشین، تشخیص الگو، تشخیص دستخط   و سایر اهداف پژوهشی دیگر به صورت رایگان در دسترس است. نسخه ی کامل تر با درخواست رسمی محققان در زمینه های فوق الذکر به صورت رایگان در دسترس خواهد بود. لطفا درخواست خود را به صورت رسمی به آدرس های زیر بفرستید.

 دکتر جواد صدری

j_sadri@encs.concordia.ca

یا

محمدرضا یگانه زاد

m.yeganehzad@gmail.com

این پایگاه داده به صورت جزیی تر در آدرس مقاله ی زیر توضیح داده شده است.

Javad Sadri, Mohammad Reza Yeganehzad, Javad Saghi, "A Novel Comprehensive Database for Offline Persian Handwriting Recognition", Published in the Journal of "Pattern Recognition (Elsevier)", Volume 60, Pages 378-393, December 2016. Currently available on-line at: http://www.sciencedirect.com/science/article/pii/S0031320316300097, December 2016.

 




ما امیدوراریم این پایگاه داده ی جامع موجب ترویچ پژوهش در حوزه های یادگیری ماشین، تشخیص الگو و تشخیص دستخط شود.



تصویری (نسخه ی کوچکی در سطح خاکستری) این پایگاه داده به صورت عمومی در دسترس و ازاینجا قابل دانلود می باشد. " لطفا اینجا را کلیک کنید ".  به زودی یک وب سایت کامل برای این پایگاه داده طراحی خواهد شد که علاوه بر دانلود کامل این پایگاه داده برای گزارش دهی آخرین پیشرفت ها، اخبار، به روزرسانی ها، اخیار، مسابقات  و مقالات چاپ شده بر اساس این پایگاه داده مورد واقع خواهد شد.


خلاصه ای از اقلام موجود در این پایگاه داده به شکل جدول زیر ارائه شده است.
Table

تعدادی از نمونه های سیاه و سفید تاریخ حرفی، رشته های رقمی، کلمات و متن که ازاین پایگاه داده برداشته شده است در تصاویر زیر مشخص است.
 

 

DateNumeral StringWords

Text