روشی کاربردی برای بازشناسی برخط حروف مجزای دست‌نویس فارسی با استفاده همزمان از دانش مربوط به بدنه اصلی و ریزحرکات

نوع مقاله: مقاله علمی فارسی

نویسندگان

1 دانشجوی کارشناسی ارشد، گروه برق و کامپیوتر - دانشکده مهندسی - دانشگاه بیرجند - بیرجند - ایران

2 استادیار، گروه برق و کامپیوتر - دانشکده مهندسی - دانشگاه بیرجند - بیرجند - ایران

3 دانشجوی دکتری، گروه برق و کامپیوتر- دانشکده مهندسی- دانشگاه بیرجند - بیرجند - ایران

چکیده

در این مقاله، روشی برای بازشناسی برخط حروف مجزای دست‌نویس فارسی ارایه می‌شود. در روش پیشنهادی برای بازشناسی حروف مجزای دست‌نویس فارسی، از دانش مربوط به بدنه اصلی و ریزحرکات به‌طور همزمان و به‌منظور اعتبار بیشتر تعیین کلاس خروجی استفاده شده‌است. در این تحقیق حروف مجزای دست‌نویس فارسی بر اساس تشابه بدنه اصلی در 18، و بر اساس تشابه ریزحرکات در 11 گروه، گروه‌بندی می‌شوند. با توجه به روش پیشنهادی ارایه‌شده در این پژوهش برای تشخیص نمونه‌های ناشناخته ورودی، بدنه اصلی و ریزحرکات شناسایی می‌شوند، اگر گروه‌های شناسایی شده از بدنه اصلی و ریزحرکات همخوانی داشته‌باشند، نمونه ناشناخته بازشناسی می‌شود؛ در غیر این‌صورت ناهمخوانی پیش‌آمده با استفاده از الگوریتم تصحیح خطا، تاحد امکان تصحیح می‌گردد. به‌منظور کاهش هزینه محاسباتی و افزایش قدرت تفکیک‌پذیری ویژگی-ها، با استفاده از روش‌های کاهش ابعاد ویژگی همچون تحلیل جداکننده خطی (LDA) و تحلیل مولفه‌های اصلی (PCA)، ابعاد بردار ویژگی‌ برای بدنه اصلی از 102 ویژگی به 17 ویژگی کاهش می‌یابد. برای طبقه‌بندی بدنه اصلی حروف و همچنین برای ریزحرکات از طبقه‌بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) استفاده شده‌است. نتایج بدست‌آمده نشان می‌دهند که با استفاده از روش پیشنهادی حدود 98 درصد از حروف مجزای دست‌نویس فارسی برخط به-درستی بازشناسی می‌شوند.

کلیدواژه‌ها


عنوان مقاله [English]

An Applied Method to Online Recognition of Farsi Handwritten Isolated Characters Using Knowledge of Main Body and Tiny Movements Simultaneously

نویسندگان [English]

  • majid marzani 1
  • mohammad razavi 2
  • mehran taghipour gorjikolaie 3
1 , Dept. of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
2 , Dept. of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
3 , Dept. of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
چکیده [English]

In this paper, a method is presented to online Farsi handwritten isolated characters. In the proposed method, the information of main body and tiny movements are simultaneously used to improve the validation of output class recognition. Farsi handwritten isolated characters are categorized in 18 groups based on similarity in main body and also 11 groups based on tiny movement. According to the proposed method in this paper, the main body and tiny movements are recognized to identify unknown input characters. If detected groups from main body and tiny movements are corresponded, the unknown character is recognized; otherwise this mistake will be corrected by correction algorithm, as much as possible. In this paper, point features and global features are extracted from main body.  Principle Component Analysis (PCA) and Linear Discriminate Analysis (LDA) are applied to reduce computational burden and to increase the quality of features. Using PCA and LDA, feature dimension is reduced from 102 to 17 for main body. One Versus One (OVO) approach of Support Vector Machine (SVM) classifier is used to classify the main body of characters and also tiny movements. The obtained results show that by using the proposed method; about 98 percent of online Farsi handwritten isolated characters are correctly recognized.

کلیدواژه‌ها [English]

  • Online Recognition
  • Linear Discriminate Analysis (LDA)
  • Principle Component Analysis (PCA)
  • Farsi handwritten isolated characters
  • Support Vector Machine (SVM)

امروزه با گسترش فناوری­های نوین که برای ارتباط با کاربر از صفحات لمسی استفاده می­کنند، نیاز به یک روش بازشناسی برخط دست­نوشته برای ارتباط با کاربر احساس می­شود. اما در پاره­ای از موارد، به دلیل کوچک بودن صفحات لمسی تعبیه شده در این ابزارها از حروف مجزا برای شناسایی دست­نوشته استفاده می­شود. این مقاله به منظور ارایه روشی سریع، دقیق و با قابلیت اطمینان[1] بالا به بازشناسی برخط حروف مجزای دست­نویس فارسی مبتنی بر پایگاه داده Online-TMU[2] [1] می­پردازد.

بازشناسی نوشتار با توجه به نحوه دریافت اطلاعات ورودی به دو دسته برون­خط[3] و برخط[4] تقسیم می­شود. بازشناسی برون­خط شامل بازشناسی نوشتار تایپی و نوشتار دست­نویس می­شود ولی بازشناسی برخط فقط در بازشناسی دست­نوشته کاربرد دارد. در بازشناسی برخط، ورودی از طریق لوح یا وسایل حساس به لمس و یا به­طور مستقیم از طریق قلم نوری دریافت می­شود. در بازشناسی برخط، مختصات نقاط مسیر حرکت قلم، تعداد حرکات قلم و در پاره­ای از موارد فشار حرکت قلم در دسترس هستند [4-2].

تاکنون در مقایسه با زبان­های لاتین برای بازشناسی برخط دست­نوشته فارسی و عربی تحقیقات کمتری انجام شده است [3,4]. در ادامه همین بخش کارهای انجام شده روی پایگاه داده Online-TMU به­طور مختصر بیان می‌شود.

در [5] حروف مجزای فارسی بر اساس نقاط و علایم بالا یا پایین بدنه اصلی به 12 گروه تقسیم می­شوند. نخست نقاط و علایم بالا یا پایین هر حرف تشخیص داده می­شود و سپس با توجه به آن گروهی که حرف ناشناخته در آن قرار می­گیرد، تعیین می­شود. در صورتی که در گروه مربوط فقط یک کلاس وجود داشته باشد، آن کلاس به حرف ناشناخته نسبت داده می­شود وگرنه بدنه حرف ناشناخته با بدنه­های حروفی از پایگاه داده که با حرف ناشناخته هم­گروه هستند مقایسه می­شود و با طبقه­بندی کمترین فاصله بازشناسی انجام می­گیرد. در [5] اگر گروه شناسایی شده از ریزحرکات ­به­نادرستی تشخیص داده­شود تعیین کلاس خروجی نهایی حرف ناشناخته منجر به خطا در بازشناسی خواهد­شد. در [6] یک روش مبتنی بر گروه­بندی، جهت بازشناسی حروف مجزای برخط فارسی مستقل از نویسنده، ارایه می‌شود. مدل­سازی با استفاده از مدل مخفی مارکوف[5] (HMM) انجام می­پذیرد و ویژگی­های متعددی از دنباله نقاط نمونه‌برداری شده از حروف دست­نوشته، جهت تخمین پارامتر­ها، استخراج شده­است. بهترین نتیجه با استفاده از ویژگی­های مشتق زمانی مرتبه اول و مولفه­های افقی و عمودی نقاط روی محورهای مختصات و تفاضل زوایای نقاط پی­درپی، به­دست آمده­است. در [6] روشی مستقل از نویسنده ارایه می­گردد به معنی دیگر محدودیتی برای نگارش حروف اعمال نشده­است اما نرخ بازشناسی قابل قبول نیست. در [7]، [8] فرآیند بازشناسی در دو مرحله انجام می­گیرد، در مرحله اول بدنه اصلی حرف ورودی (اولین حرکت قلم) در قالب یکی از هجده گروه بدنه اصلی حروف، طبقه­بندی[6] می­شود و سپس در مرحله­ی دوم موقعیت، تعداد و شکل سایر حرکت­ها مانند نقطه و سرکش (ریزحرکت­ها)، حرف نهایی را تعیین می‌کند، که در [7] طبقه­بندی با مدل مخفی مارکوف (HMM) و در [8] با استفاده از ماشین بردار پشتیبان [7](SVM) انجام می­شود. در [7]، [8] برای تعیین کلاس خروجی نهایی حرف ناشناخته بعد از تشخیص بدنه اصلی حروف برای ریزحرکت­ها محدودیتی اعمال شده­است که در بخش دوم تشریح می‌گردد. در [9] استخراج ویژگی­های حروف تنهای فارسی که به صورت برخط نوشته شده­ باشند به­منظور گروه­بندی درست آن­ها، ارایه شده­است. حروف بر اساس شکل و ساختار بدنه اصلی آن­ها به 9 گروه تقسیم می­شوند و ویژگی­های ساختاری تعیین می­گردد. گروه­بندی با استفاده از درخت تصمیم[8] انجام می­شود. در آموزش درخت تصمیم، برای هر حرف ورودی از مجموعه تمرین، تمام ویژگی­ها محاسبه می­شود و درخت تصمیم هر ویژگی را در جایی که لازم است و به بازشناسی کمک می­کند به­کار می­گیرد. در [9] برای استخراج ویژگی­های ساختاری تنوع نگارشی حروف مختلف در نظر گرفته نشده­است. در [10] یک رویکرد فازی[9] برای بازشناسی و یادگیری حروف مجزای برخط فارسی معرفی شده­است. یک الگوریتم تکه­بندی سلسله مراتبی معرفی می­شود و برای توصیف و شناسایی تکه­های بدنه­ اصلی حروف از دسته­بند فازی استفاده می‌شود. بعد از مقایسه­ی بدنه­ی ورودی با الگوهای بدنه حروف، مقایسه­ی علایم ثانویه صورت می­گیرد. این علایم نیز با قوانین فازی توصیف می­شوند. در [10] سرعت قابل ملاحضه­ای برای بازشناسی حروف ناشناخته ارایه شده­است اما نرخ بازشناسی قابل قبول نیست.

در این مقاله، روشی برای بازشناسی برخط حروف مجزای دست­نویس فارسی ارایه می­شود. در روش پیشنهادی برای بازشناسی حروف مجزای دست­نویس فارسی، از دانش مربوط به بدنه اصلی و ریزحرکات به­طور همزمان و به­منظور اعتبار بیشتر تعیین کلاس خروجی استفاده شده­است. در این تحقیق حروف مجزای دست­نویس فارسی بر اساس تشابه بدنه اصلی در 18 گروه، و بر اساس ریزحرکات در 11 گروه، گروه­بندی می­شوند. برای مثال، سیستم برای حرف «»، بدنه اصلی «» و ریزحرکات «» را شناسایی می­کند، اگر گروه­ شناسایی شده از بدنه اصلی و گروه شناسایی شده از ریزحرکات همخوانی داشته باشند، نمونه ناشناخته بازشناسی می­شود. در صورت بروز ناهمخوانی احتمالی بین گروه­های شناسایی شده از بدنه اصلی و ریزحرکات تصمیم­گیری نهایی برای تعیین کلاس خروجی به عملیات پس­پردازش واگذار می­شود. در عملیات پس­پردازش ناهمخوانی پیش­آمده با استفاده از الگوریتم تصحیح خطا، تاحد امکان تصحیح می­گردد. در بازشناسی برخط مهم­ترین چالش تنوع زیاد در سبک نگارش افراد مختلف است. بنابراین یک روش بازشناسی باید نسبت به تغییرات جزیی که در نگارش یک حرف ممکن است رخ دهد، حساس نباشد ولی حروف متفاوتی را که شبیه به هم نوشته می­شوند را به­درستی از یکدیگر تشخیص دهد.

در ادامه این مقاله، در بخش دوم پایگاه داده معرفی و نگارش حروف بیان می­شود. در بخش سوم الگوریتم پیشنهادی بازشناسی برخط حروف مجزای دست­نویس فارسی به­طور کامل تشریح می­گردد. در بخش چهارم آزمایش­ها و ارزیابی نتایج ارایه می­گردد. در پایان و در بخش پنجم نتیجه­گیری ارایه می­شود.

 

1- معرفی پایگاه داده و نگارش حروف

مجموعه داده Online-TMU توسط دانشکده مهندسی برق دانشگاه تربیت مدرس جمع­آوری شده­است. این مجموعه داده شامل 4022 حرف مجزا از مجموعه حروف فارسی می­باشد که 124 نفر آن­ها را با قلم صفحهWACOM GRAPHIRE  نوشته­­اند، شایان ذکر است که بیشتر نویسندگان برای اولین بار از قلم نوری و صفحه روقومی کننده[10] استفاده کرده­اند. در نوشتن حروف اعم از بدنه اصلی و ریزحرکات هیچ محدودیتی اعمال نشده­است [5]. شکل (1) نمونه­ای از نگارش حروف مجزای فارسی در پایگاه داده Online-TMU را نشان می‌دهد.

 

 

شکل (1) : نمونه­ای از نگارش حروف مجزای دست­نویس فارسی [5].

 

حروف مجزا در نگارش فارسی دارای دو قسمت می‌باشند. قسمت اصلی حروف مجزا «بدنه»، و علایمی مانند نقطه، سرکش و دسته «ریزحرکت» نامیده می­شوند [8,10]. زبان فارسی شامل 32 حرف است. 17 حرف از این حروف دارای نقطه هستند. تعداد نقاط این حروف بین یک تا سه متغیر است. نقاط ممکن است در بالا، پایین یا داخل بدنه حرف قرار گیرند. در پایگاه داده Online-TMU فرض بر این است که نویسنده حرف را به فرم متعارف نوشته­است. یعنی ابتدا بدنه اصلی حرف را در یک حرکت قلم و سپس ریزحرکات را نوشته­است. اما نمونه­هایی نیز وجود دارند که به فرم متعارف نوشته نشده­اند. تعداد این نمونه­ها 67 مورد است. در شکل (2) نمونه­هایی از داده­ها با ساختار متعارف و ساختار نامتعارف قابل مشاهده می­باشند. نقاط سیاه پررنگ نقطه اول هر حرکت قلم را نشان می­دهد. شماره کنار هر حرکت قلم نشان دهنده ترتیب نوشتن حرکات قلم است.

 

(الف)

 

(ب)

 

شکل (2) : نمونه­هایی از نگارش حروف [5]، (الف) نگارش متعارف، (ب) نگارش نامتعارف.

 

همان­طور که بیان شد در نحوه نوشتن بدنه اصلی و همچنین نقاط هیچ محدودیتی در نظر گرفته نشده­است [5]. به عنوان مثال برای حرف دست­نویس «پ» نمونه به صورت دو حرکتی «» و سه حرکتی «» و چهار حرکتی «» موجود است [6]. در [7,8] برای نوشتن ریزحرکت‌ها محدودیتی اعمال شده­است، به این ترتیب که «سه نقطه» می­بایست از ترکیب «دونقطه» و «تک نقطه» تشکیل شده باشد. به علاوه دسته «ط» و «ظ» و سرکش «ک» و «گ» می­بایست در حرکتی به جز حرکت بدنه اصلی نوشته شود. به عبارت دیگر حروف «ط» و «ک» باید در دو حرکت قلم و حروف «ظ» و «گ» باید در سه حرکت قلم نوشته شوند. حال آن­که در پایگاه داده Online-TMU برای نگارش حروف هیچ محدودیتی در نظر گرفته نشده­است.

شایان ذکر است که برای حروف مجزای پایگاه داده Online-TMU استفاده­شده در این تحقیق هیچ نمونه­ای حذف نشده­است. و همچنین محدودیتی برای نگارش ریزحرکات اعمال نشده­است.

 

2- روش پیشنهادی

در روش ارایه شده برای بازشناسی حروف مجزای فارسی از اطلاعات مربوط به بدنه اصلی و ریزحرکات به‌طور همزمان استفاده شده­است. به عنوان مثال برای حرف «چ» بدنه اصلی و ریزحرکات شناسایی می­شوند. اگر گروه شناسایی شده از بدنه با گروه شناسایی شده از ریزحرکات همخوانی داشته باشند، نمونه ناشناخته شناسایی می­شود. در غیر این­صورت با استفاده از الگوریتم تصحیح خطا ناهمخوانی پیش­آمده تاحد امکان تصحیح می­گردد. در این تحقیق حروف مجزای دست­نویس فارسی بر اساس تشابه بدنه اصلی آن­ها به 18 گروه و بر اساس ریزحرکات به 11 گروه تقسیم می­شوند که به ترتیب در جدول (1) و (2) قابل مشاهده هستند.

در فرآیند بازشناسی و قبل از طبقه­بندی داده­ها، پردازش­هایی روی داده­ها انجام می­گیرد. ابتدا به­منظور یکنواخت کردن، پیش­پردازش[11] روی داده خام انجام می‌گیرد. سپس برای بهره بردن از ویژگی­های قابل استفاده، استخراج ویژگی[12] انجام می­شود. در ادامه به­منظور استفاده از ویژگی­های کارآمد کاهش ابعاد ویژگی[13] انجام می­شود. سپس طبقه­بندی انجام می­گیرد و در نهایت پس­پردازش[14] انجام می­شود.

 

جدول (1) : گروه­بندی حروف بر اساس بدنه اصلی

گروه

اعضا گروه

 

گروه

اعضا گروه

1

ا،آ

 

10

ف

2

ب،پ،ت،ث

 

11

ق

3

ج،چ،ح،خ

 

12

ک،گ

4

د،ذ

 

13

ل

5

ر،ز،ژ

 

14

م

6

س،ش

 

15

ن

7

ص،ض

 

16

و

8

ط،ظ

 

17

ه

9

ع،غ

 

18

ی

 

جدول (2) : گروه­بندی حروف بر اساس ریزحرکات

گروه

اعضا گروه

نوع ریزحرکات

1

ا،ح،د،ر،س،ص،ع،ل،م،و،ه،ی

بدون ریزحرکت

2

آ

یک مد بالا

3

ب،ج

یک نقطه پایین

4

خ،ذ،ز،ض،غ،ف،ن

یک نقطه بالا

5

ت،ق

دو نقطه بالا

6

ث،ژ،ش

سه نقطه بالا

7

پ،چ

سه نقطه پایین

8

ک

یک سرکش بالا

9

گ

دو سرکش بالا

10

ط

یک دسته بالا

11

ظ

یک دسته و یک نقطه بالا

 

در فرآیند بازشناسی و قبل از طبقه­بندی داده­ها، پردازش­هایی روی داده­ها انجام می­گیرد. ابتدا به­منظور یکنواخت کردن، پیش­پردازش[15] روی داده خام انجام می‌گیرد. سپس برای بهره بردن از ویژگی­های قابل استفاده، استخراج ویژگی[16] انجام می­شود. در ادامه به­منظور استفاده از ویژگی­های کارآمد کاهش ابعاد ویژگی[17] انجام می­شود. سپس طبقه­بندی و در نهایت پس­پردازش انجام می­شود.

 

 

2-1- پیش­پردازش

پیش­پردازش یکی از مراحل اساسی در بازشناسی دست­نوشته می­باشد که اجرای صحیح آن کمک شایان توجهی به بهبود نرخ بازشناسی می­کند [11]. از آن­جایی که داده­های برخط با قلم نوری روی صفحه حساس به لمس نوشته می­شوند، تنوع زیادی در تعداد و فاصله بین نقاط و همچنین ابعاد داده­های نمونه­برداری شده دارند. از این­رو برای این­که بتوان تغییرات در تنوع نوشتاری را به حداقل رساند می­بایست پیش­پردازش­هایی روی داده­­­ها انجام داد [12]. در این پژوهش روی بدنه اصلی حروف پیش‌پردازش­هایی چون حذف نقاط تکراری، حذف قلاب، پالایش نقاط، یکسان­سازی تعداد نقاط و فاصله بین آن­ها، یکسان­سازی ابعاد و انتقال به مبدا مختصات انجام شده‌است، که در ادامه توضیحاتی در این زمینه ارایه ‌می‌گردد.

 

2-1-1- حذف نقاط تکراری

با بررسی مختصات نقاط نمونه­برداری شده، اگر موقعیت مکانی یکسانی برای نقاط وجود داشته باشد یکی از آن­ها نگه­داشته شده و بقیه حذف می­شوند [12].

 

2-1-2- حذف قلاب

قلاب­ها معمولا در ابتدا و انتهای حرکت قلم ظاهر می‌شوند. مشخصه قلاب­ها طول کوتاه و تغییر زاویه زیاد است [12,13]. با استفاده از این پیش­پردازش می­توان حرکات اضافی ابتدا و انتهای حرکت قلم را تا حد قابل قبولی از بین برد. بنابراین قلاب­ها با استفاده از دو مشخصه ذکر شده تشخیص داده شده و سپس حذف می­شوند.

 

2-1-3- پالایش نقاط

نقاطی که فاصله بین آن­ها کمتر از دو برابر میانگین فواصل بین نقطه­ای باشد حذف می­شوند. با استفاده از این پیش­پردازش می­توان لرزش حرکت دست هنگام نوشتن را تا حدی از بین برد [8]. در شکل (3) نمونه­ای از پالایش نقاط دیده می­شود.

 

(الف)

(ب)

شکل (3) : نمونه­ای از پالایش نقاط، (الف) قبل از پیش پردازش، (ب) بعد از پیش­پردازش.

 

2-1-4- یکسان‌سازی تعداد نقاط و فاصله بین آن‌ها

ابتدا با استفاده از درون­یابی بین نقاط نمونه­برداری شده از حرکت قلم، مسیر حرکت قلم تخمین زده می­شود. سپس با در دست داشتن طول حرکت قلم، 50 نقطه که فاصله­ی یکسانی از هم دارند استخراج می­شود [12,13]. شکل (4) نمونه­ای از یکسان­سازی در تعداد نقاط و فاصله بین آن­ها را نشان می­دهد.

 

 

(الف)

(ب)

شکل (4) : نمونه­ای از یکسان­سازی نقاط و فاصله بین آن­ها، (الف) قبل از پیش­پردازش، (ب) بعد از پیش­پردازش.

 

2-1-5- یکسان‌سازی ابعاد و انتقال به مبدا

از آن­جایی که ابعاد نویسه­ها در داده­های نمونه­برداری شده برای افراد مختلف متفاوت است، بنابراین همه نمونه­ها در یک چارچوب 100×100 قرار می­گیرند. همچنین برای یکسان­سازی در نقطه شروع حرکت قلم، نقطه­ی آغازین حرکت قلم به نقطه (0,0) انتقال داده می­شود [5,8].

 

2-2- استخراج ویژگی

هدف از استخراج ویژگی، افزایش کیفیت الگوهای ورودی با استخراج و محاسبه خصوصیات و پارامترهای مربوط به سیگنال ورودی می­باشد که منجر به بهبود عملکرد طبقه­بندی کننده روی الگوهای ورودی می­شود [11]. به عبارت دیگر برای طبقه­بندی نمونه­ها، به مجموعه­ای از ویژگی­ها با قابلیت تمایز بالا نیاز است [14,15]. در این مقاله از دو مجموعه ویژگی برای طبقه­بندی بدنه اصلی حروف استفاده شده­است.

 

2-2-1- ویژگی‌های نقطه‌ای

برای پنجاه نقطه بدست آمده از مرحله پیش­پردازش، تغییرات در راستای افقی (Δx) و تغییرات راستای عمودی (Δy) به عنوان ویژگی­های نقطه­ای استخراج می­­شود، که در روابط (3) و (4) قابل مشاهده هستند. شکل (5) تغییرات در راستای افقی و راستای عمودی را برای سه نقطه متوالی نشان می­دهد [16].

(1)

 

(2)

 

 

 

شکل (5) : ویژگی نقطه­ای برای سه نقطه متوالی.

 

2-2-2- ویژگی­های سراسری

زاویه بردار ابتدا به انتهای حرکت قلم، اندازه بردار ابتدا به انتهای حرکت قلم، اندازه حرکت قلم در راستای افقی و اندازه حرکت قلم در راستای عمودی چهار ویژگی استخراج شده از حرکت قلم به عنوان ویژگی سراسری هستند [17]. این ویژگی­ها در روابط (3) تا (6) مشاهده می­شوند. همچنین نحوه استخراج ویژگی­های سراسری برای حروف با یک حرکت قلم و بیش از یک حرکت قلم به ترتیب در شکل­های (6) و (7) مشاهده می­شوند.

 

(3)

 

(4)

 

(5)

 

(6)

 

 

در روابط فوق xminو max به ترتیب مقدار حداقل و حداکثر در راستای محور افقی، yminوymax به ترتیب مقدار حداقل و حداکثر در راستای محور عمودی، xstartو xend به ترتیب مقدار نقطه آغازین و نقطه پایانی در راستای محور افقی، ystartوyendبه ترتیب مقدار نقطه آغازین و نقطه پایانی در راستای محور عمودی هستند. همچنین  و به ترتیب زاویه ابتدا به انتها[18] و بردار ابتدا به انتها می­باشند.

 

شکل (6) : نحوه استخراج ویژگی­های سراسری برای حروف با یک حرکت قلم.

 

بردار و زاویه ابتدا به انتها برای حروفی که تعداد حرکات قلم در آن­ها از یک بیشتر است از جمع بردار و زاویه ابتدا به انتهای اول و دوم مانند شکل (7) بدست می‌آید.

 

شکل (7) : نحوه استخراج ویژگی­های سراسری برای حروف با بیش از یک حرکت قلم.

2-2-3- ویژگی­های استخراج شده از ریزحرکات

ویژگی­های استخراج شده از ریزحرکات شامل ویژگی‌های ساختاری و چند ویژگی استخراج شده از ریزحرکات اول و دوم در صورت وجود می­باشد، که عبارتند از:

1. تعداد ریزحرکات (با توجه به شکل (8) می­تواند بین «0» تا «3» باشد).

2. تشخیص بالا یا پایین بودن ریزحرکات (اگر ریزحرکت پایین باشد «1-»، اگر ریز حرکت بالا باشد «1» و اگر ریزحرکت موجود نباشد «0» در نظر گرفته می­شود).

3. طول حرکت قلم برای ریزحرکت اول و ریزحرکت دوم که از مجموع فاصله­های اقلیدسی جفت نقاط متوالی موجود بدست می­آید.

4. بردار و زاویه ابتدا به انتها برای ریزحرکت اول و ریزحرکت دوم.

5. طول حرکت قلم در راستای افقی برای ریزحرکت اول و ریزحرکت دوم.

 6. طول حرکت قلم در راستای عمودی برای ریزحرکت اول و ریزحرکت دوم.

لازم به تذکر است که، ویژگی­های استخراج شده 3 تا 6 برای ریزحرکات اول و دوم در صورت وجود استخراج می‌شود و در غیر این­صورت صفر در نظر گرفته می­شود.

 

بدون ریزحرکت

 

یک ریزحرکت

 

دو ریزحرکت

 

سه ریزحرکت

 

شکل (8) : تعداد ریزحرکات.

 

2-3- کاهش ابعاد ویژگی

بالا بودن ابعاد ویژگی مشکلاتی از جمله بالا رفتن زمان اجرا (افزایش هزینه محاسباتی) و افزایش پیچیدگی مساله را به همراه خواهد داشت. روش­های کاهش ابعاد به دو دسته انتخاب ویژگی و استخراج ویژگی تقسیم می­شوند. استخراج ویژگی به معنی تبدیل داده­های اولیه با همه متغیر‌ها به یک مجموعه داده با تعداد متغیرهای کمتر و قدرت تفکیک­پذیری بالاتر است. در استخراج ویژگی از همه متغیر­های موجود استفاده می­شود تا داده­ها به وسیله تبدیلی خطی یا غیرخطی به فضای ویژگی با ابعاد کمتر انتقال یابند. بنابراین در استخراج ویژگی هدف این­است که داده­هایی با تعداد متغیر کمتر جایگزین داده­های اولیه شوند. به این معنی که ویژگی­ها از یک فضای با dبعد به فضایی با kبعد منتقل می­شوند که k<dمی­باشد.

با استفاده از کاهش ویژگی می­توان مجموعه ویژگی­های مناسب به ویژه برای طبقه­بندهای ساده­تر فراهم نمود. همچنین از این طریق می­توان اثر مخرب اطلاعات تکراری را کاهش داد.

 

2-3-1- تحلیل مولفه‌های اصلی (PCA)

هدف از تحلیل مولفه­های اصلی [19](PCA) ، تولید متغیر­های جدیدی است که اولا ترکیب خطی از متغیرهای اولیه باشند و ثانیا متغیرها همبستگی کمی به یکدیگر داشته باشند. از لحاظ هندسی، تحلیل مولفه­های اصلی را می­توان دوران محورهای مختصات اولیه به محورهای عمودی جدید دانست به صورتی که بر اساس واریانس متغیر­های اولیه مرتب شده­اند. یکی از اهداف تحلیل مولفه­های اصلی، پیدا کردن گروه­های کوچک­تری از متغیرهای اساسی است که بتوانند داده­ها را توصیف کنند. برای انجام این­کار، می‌بایست مولفه­های اصلی اولیه بتوانند پراکندگی زیادی از داده­های اولیه را تشکیل دهند.

2-3-2- تحلیل جداکننده خطی (LDA)

تحلیل جداکننده خطی [20](LDA) از روش­های آماری است. در این روش داده­ها روی خطی جهت­دار تصویر می‌شوند که برای طبقه­بندی مناسب­تر است. به عبارت ساده­تر ایده اصلی در تحلیل جداکننده خطی یافتن خطی است که داده­ها را از کلاس­های مختلف به صورتی روی آن تصویر شوند که به خوبی قابل تفکیک باشند. تحلیل جداکننده خطی با تحلیل مولفه­های اصلی شباهت دارد. از این نظر که، هردوی این روش­ها برای ترکیب خطی متغیرها به شکلی که داده را به بهترین نحو توضیح بدهد به­کار می‌روند. تفاوت اصلی تحلیل جداکننده خطی با تحلیل مولفه‌های اصلی این است که، در تحلیل جداکننده خطی تفاوت کلاس­ها مدل­سازی می­شود. به این معنی که اگر تعداد کلاس­ها برابر C باشد، با استفاده از تحلیل جداکننده خطی بردار ویژگی را می­توان حداکثر بهC-1 تصویر نمود.

همان­طور که در بخش قبل اشاره شد 98 ویژگی نقطه‌ای و 4 ویژگی سراسری، در مجموع 102 ویژگی از داده پیش­پردازش شده استخراج می­شود. که با استفاده از تحلیل جدا کننده خطی (LDA) و تحلیل مولفه­های اصلی (PCA) تعداد ویژگی­ها به 17 کاهش می­یابد.

 

2-4- طبقه­بندی

بازشناسی حروف مجزای دست­نویس فارسی به­طور همزمان، با شناسایی بدنه اصلی و ریزحرکات انجام می­گیرد. بنابراین می­بایست دو طبقه­بند به­طور همزمان طبقه­بندی بدنه اصلی حروف و ریزحرکات را انجام دهند.

در این مقاله پیشنهاد می­شود طبقه­بندی بدنه­ی اصلی حروف با استفاده از کاهش ابعاد ویژگی به روش تحلیل جداکننده خطی (LDA) یا تحلیل مولفه­های اصلی (PCA) و طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک [21](OVO) انجام شود. همچنین پیشنهاد می­شود که طبقه­بندی ریزحرکات با استفاده از ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) همزمان با بدنه اصلی انجام ­گیرد. لذا به­منظور اثبات روش پیشنهادی، روندی در نظر گرفته شده­است که در ابتدا بدنه اصلی حروف با ویژگی­های نقطه­ای و طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل همه [22](OVA) [18] طبقه­بندی می­شود. سپس با اضافه کردن ویژگی­های سراسری به ویژگی­های نقطه­ای، عملکرد طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل همه (OVA) بررسی می­شود. در ادامه با استفاده از کاهش ابعاد ویژگی به روش تحلیل جداکننده خطی (LDA) و تحلیل مولفه­های اصلی (PCA) ابعاد ویژگی برای بدنه اصلی از 102 ویژگی به 17 ویژگی کاهش می­یابد، و بازشناسی با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل همه (OVA) انجام می­شود و مقایسه­ای بین نتایج دو روش کاهش ابعاد ویژگی مطرح شده انجام می‌گیرد. در آخر با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) [19] مراحل قبلی تکرار می­شود و نتایج حاصل از آن بررسی می­شود .

 

2-5- پس‌پردازش

همان­طور که در ابتدای بخش سوم مطرح شد، بازشناسی حروف مجزای دست­نویس فارسی به­طور همزمان، با شناسایی بدنه اصلی و ریزحرکات انجام می­گیرد. به این ترتیب که اگر گروه شناسایی شده از بدنه اصلی با گروه شناسایی شده از ریزحرکات همخوانی داشته باشند، بازشناسی نهایی انجام می­گیرد، اما اگر همخوانی بین گروه شناسایی شده از بدنه اصلی با ریزحرکات وجود نداشته باشد با استفاده از الگوریتم تصحیح خطا، ناهمخوانی موجود تصحیح می­گردد. به عنوان مثال اگر سیستم پیشنهادی بدنه اصلی نمونه ناشناخته را به اشتباه گروه (11) «ق» و ریزحرکت مربوطه را به­طور صحیح (4) «یک نقطه بالا» تشخیص دهد، این ناهمخوانی بین گروه شناسایی شده از بدنه اصلی و ریزحرکات تصحیح شده و به بازشناسی حرف «ف» می­انجامد. همچنین اگر سیستم پیشنهادی بدنه اصلی نمونه ناشناخته را به اشتباه گروه (15) «ن» و ریزحرکت مربوطه را به­طور صحیح (1) «بدون ریزحرکت» تشخیص دهد، این ناهمخوانی بین گروه شناسایی شده از بدنه اصلی و ریزحرکات تصحیح شده و به بازشناسی حرف «ل» می‌انجامد. الگوریتم تصحیح خطای پیشنهادی در صورت بروز ناهمخوانی بوجود آمده از شناسایی بدنه اصلی و ریزحرکات وارد عمل شده و به بازشناسی صحیح کمک می­کند.

همچنین سیستم پیشنهادی تا حد قابل قبولی می­تواند حروفی که نامتعارف نگارش شده­اند را بازشناسی کند. به عنوان مثال برای حرف «ط» که با یک حرکت قلم نوشته شده­است، اگر سیستم بدنه اصلی نمونه ناشناخته را گروه (8) «ط،ظ» و ریزحرکت مربوطه را گروه (1) «بدون علامت» تشخیص دهد، با توجه به قدرت بالای طبقه­بند استفاده شده برای بدنه اصلی حروف، این نمونه ناشناخته به بازشناسی حرف «ط» منجر می­شود. شکل (9) نمودار جعبه‌ای روش پیشنهادی برای بازشناسی برخط حروف مجزای فارسی را نمایش می­دهد.

 

3- آزمایش‌ها و ارزیابی نتایج

همان­طور که در بخش دوم به معرفی پایگاه داده و نگارش حروف پرداخته شده­است، روش پیشنهادی ارایه شده در این مقاله روی حروف مجزای پایگاه داده
Online-TMU انجام شده­است.

 

 

شکل (9) : نمودار جعبه­ای روش پیشنهادی برای بازشناسی برخط حروف مجزای فارسی.

 

نسبت داده­های آموزشی و آزمایشی به کل نمونه­ها در تمام آزمایش­های انجام شده به ترتیب 7/0 و 3/0 است، که برای ده بار اجرای برنامه و برای هر بار اجرا، به صورت تصادفی می­باشد. شایان ذکر است نتایج هر جدول دارای شرایط برابری از نظر تصادفی بودن داده­های آموزشی و آزمایشی برای ده بار اجرا می­باشد. لذا برای ده­بار اجرای مجزا مقادیر حداقل و حداکثر و میانگین در جدول­ها ارایه شده­اند. نتایج حاصل از آزمایش­ها در جدول­های (1) تا (7) گردآوری شده است. لازم به تذکر است که، در تمام جدول­ها روند بازشناسی بدنه اصلی بررسی می­شود و بازشناسی ریزحرکات همان­طور که بیان شد با طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) انجام می­شود. با در طبقه­بندی بدنه اصلی حروف، برای SVM با رویکرد OVA و همچنین SVM با رویکرد OVO، همچنین در طبقه­بندی ریزحرکات، برای SVM با رویکرد OVO از کرنل گوسی[23] استفاده شده است، که مقدار پارامتر σ به ترتیب برابر 85/3، 7 و 4 انتخاب شده‌است.

 

 

جدول (3) : نتایج بازشناسی حروف مجزای دست­نویس فارسی با استفاده از طبقه­بند SVM با رویکرد OVA برای بدنه اصلی حروف

 

ویژگی­های نقطه­ای برای بدنه اصلی

ویژگی­های نقطه­ای و سراسری برای بدنه اصلی

 

بازشناسی بدنه

بازشناسی ریزحرکات

بازشناسی نهایی

بازشناسی بدنه

بازشناسی ریزحرکات

بازشناسی نهایی

حداقل

08/85

78/96

91/84

12/88

78/96

71/87

حداکثر

38/87

43/98

06/87

10/90

43/98

29/89

میانگین

50/86

52/97

18/86

35/89

52/97

79/88

 

جدول (4) : نتایج بازشناسی حروف مجزای دست­نویس فارسی با استفاده از طبقه­بند SVM با رویکرد OVA و کاهش ابعاد ویژگی به روش­های LDA و PCA برای بدنه اصلی حروف

 

LDA برای بدنه اصلی

PCA برای بدنه اصلی

 

بازشناسی بدنه

بازشناسی ریزحرکات

بازشناسی نهایی

بازشناسی بدنه

بازشناسی ریزحرکات

بازشناسی نهایی

حداقل

00/92

03/97

59/91

98/93

03/97

24/93

حداکثر

14/94

85/97

98/93

05/95

85/97

72/94

میانگین

21/93

45/97

88/92

47/94

45/97

04/94

 

 

در جدول (3) نتایج حاصل از طبقه­بندی بدنه اصلی با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل همه (OVA)، همچنین طبقه­بندی ریزحرکات با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) و در آخر بازشناسی نهایی حروف مجزای دست­نویس فارسی مشاهده می­شود. همان­طور که مشاهده می­شود، با اضافه شدن ویژگی­های سراسری به ویژگی­های نقطه­ای میانگین نرخ بازشناسی نهایی بالا رفته­است و این به جهت بالا رفتن نرخ بازشناسی بدنه اصلی می­باشد.

همان­طور که پیش­تر بیان شد، با بالا رفتن ابعاد ویژگی هزینه محاسباتی (زمان محاسبات) و در نتیجه پیچیدگی مساله افزایش می­یابد. بنابراین انتظار می­رود با استفاده از کاهش ابعاد ویژگی، زمان محاسبات کاهش یابد و در صورت امکان نرخ بازشناسی بالا رود. جدول (4) مقایسه­ای بین نتایج حاصل از طبقه­بندی بدنه اصلی، ریزحرکات و نرخ بازشناسی نهایی با استفاده کاهش ابعاد ویژگی به روش تحلیل جداکننده خطی (LDA) و تحلیل مولفه­های اصلی (PCA) را نشان می­دهد، که ویژگی­های بدنه اصلی از 102 ویژگی به جهت مقایسه­ای صحیح بین دو روش LDA و PCA به 17 ویژگی کاهش یافته­اند. همان­طور که مشاهده می­شود در روش تحلیل جدا کننده خطی (LDA) و همچنین در روش تحلیل مولفه­های اصلی (PCA) میانگین نرخ بازشناسی نهایی بالا رفته­است و این به جهت بالا رفتن نرخ بازشناسی بدنه اصلی می­باشد.

 

 

 

جدول (5) : نتایج بازشناسی حروف مجزای دست­نویس فارسی با استفاده از طبقه­بند SVM با رویکرد OVO برای بدنه اصلی حروف

 

ویژگی­های نقطه­ای و سراسری

برای بدنه اصلی

LDA

برای بدنه اصلی

PCA

برای بدنه اصلی

 

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

حداقل

96/95

70/96

55/95

20/97

70/96

37/96

36/97

70/96

78/96

حداکثر

53/97

94/97

87/96

27/98

94/97

77/97

60/98

94/97

61/97

میانگین

85/96

48/97

35/96

36/97

48/97

20/97

97/97

48/97

29/97

 

جدول (6) : زمان تصمیم­گیری برای یک نمونه ناشناخته با استفاده از رویکردهای  OVA و OVO

 

OVA

 

ویژگی­های نقطه­ای و سراسری

برای بدنه اصلی

LDA

برای بدنه اصلی

PCA

برای بدنه اصلی

 

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

زمان ms))

29/11

36/4

65/15

18/10

36/4

54/14

96/9

36/4

32/14

 

OVO

 

ویژگی­های نقطه­ای و سراسری

برای بدنه اصلی

LDA

برای بدنه اصلی

PCA

برای بدنه اصلی

 

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

بازشناسی

بدنه

بازشناسی

ریزحرکات

بازشناسی

نهایی

زمان (ms)

90/4

36/4

26/9

36/3

36/4

72/7

30/3

36/4

66/7

 

 

در جدول (5) نتایج حاصل از طبقه­بندی بدنه اصلی با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) با استفاده از ویژگی­های اصلی و کاهش ابعاد ویژگی به روش تحلیل جداکننده خطی (LDA) و تحلیل مولفه­های اصلی (PCA) و همچنین طبقه­بندی ریزحرکات با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) و در آخر بازشناسی نهایی حروف مجزای دست­نویس فارسی مشاهده می­شود، که ویژگی­های بدنه اصلی از 102 ویژگی به 17 ویژگی کاهش یافته­اند. همان­طور که مشاهده می­شود، استفاده از رویکرد یک در مقابل یک (OVO) برای طبقه­بند ماشین بردار پشتیبان (SVM) نسبت به رویکرد یک در مقابل همه (OVA) بالا رفتن نرخ بازشناسی نهایی به جهت بالا رفتن نرخ بازشناسی بدنه اصلی حروف را به همراه خواهد داشت. همچنین میانگین نرخ بازشناسی نهایی به ترتیب در روش تحلیل جداکننده خطی (LDA) و تحلیل مولفه­های اصلی (PCA) به جهت بالا رفتن نرخ بازشناسی بدنه اصلی حروف، مشاهده می­شود. همان­طور که مشاهده می­شود، بهترین نرخ بازشناسی نهایی برای حروف مجزای دست­نویس فارسی با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) برای بدنه اصلی همچنین برای ریزحرکات با استفاده از کاهش ویژگی ابعاد به روش تحلیل مولفه­های اصلی (PCA) بدست آمده­است، که میانگینی برابر با 29/97 درصد دارد.

جدول (6) زمان تصمیم­گیری برای یک نمونه ناشناخته را برای بازشناسی بدنه اصلی و ریزحرکات نشان می­دهد، مشاهده می­شود که استفاده از رویکرد یک در مقابل یک (OVO) برای طبقه­بند ماشین­ بردار پشتیبان (SVM) زمان بازشناسی بدنه اصلی را کاهش داده­است که منجر به کاهش زمان مجموع می­شود. همان­طور که انتظار می­رود، مشاهده می­شود که استفاده از کاهش ابعاد ویژگی به روش­های LDA و PCA زمان تصمیم­گیری برای بازشناسی بدنه اصلی را کاهش می­دهد.

جدول (7) ماتریس آسیمگی[24] میانگین ده­بار اجرای طبقه­بند SVM با رویکرد OVO و کاهش ابعاد ویژگی به روش PCA برای طبقه­بندی بدنه اصلی را نشان می­دهد. اعداد روی قطر اصلی میانگین تعداد نمونه­های آزمایشی برای بدنه اصلی حروف که در ده­بار اجرای برنامه به درستی طبقه­بندی شده­اند را نشان می­دهد. شاخص­های دقت یا (نرخ) بازشناسی[25] و قابلیت اطمینان معیارهای مهمی برای ارزیابی عملکرد سیستم می­باشند. نرخ بازشناسی میزان عملکرد طبقه­بند در تشخیص الگو و قابلیت اطمینان میزان اعتبار تصمیم گرفته­شده توسط طبقه­بند را بیان می­کنند. همان­طور که مشاهده می­شود نرخ بازشناسی برای گروه­های «ب،پ،ت،ث»، «ج،چ،ح،خ» و «ر،ز،ژ» که اعضای بیشتری دارند بیش از 98 درصد است و با توجه به اینکه سیستم پیشنهادی، تصمیم­گیری نهایی را همزمان با توجه به گروه شناسایی شده از بدنه اصلی و ریزحرکات انجام می­دهد می‌تواند با استفاده از شناسایی ریزحرکات به­راحتی بازشناسی نهایی را انجام دهد. همچنین نرخ بازشناسی برای گروه «ا،آ» 100 درصد است و این به این معنی است که سیستم پیشنهادی همه­ی بدنه­های آزمایش شده از این گروه را به درستی تشخیص داده است و می­تواند با استفاده از شناسایی ریزحرکات بازشناسی نهایی را به­راحتی انجام دهد. به عنوان مثال، شباهت بدنه اصلی گروه «ف» با گروه­ «ق» باعث شده تا نرخ بازشناسی برای گروه «ف» به 81/90 درصد کاهش یابد، که باعث می­شود سیستم پیشنهادی در تصمیم­گیری نهایی با ناهمخوانی بین گروه شناسایی شده از بدنه اصلی و ریزحرکات مواجه ­شود، سیستم پیشنهادی در مواجهه با این ناهمخوانی، با استفاده از از الگوریتم تصحیح خطا (که در بخش 3-5 ارایه شده­است) می­تواند تا حد قابل قبولی این ضعف را تصحیح کند.


 

جدول (7) : ماتریس آسیمگی (Confusion) برای میانگین ده­بار اجرای طبقه­بند بدنه اصلی با استفاده از SVM با رویکرد OVO

خروجی

هدف

ا

آ

ب پ

ت ث

ج چ ح خ

د

ذ

ر ز

ژ

س

ش

ص ض

ط

ظ

ع

غ

ف

ق

ک

گ

ل

م

ن

و

ه

ی

نرخ

بازشناسی(%)

ا آ

74

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

100

ب پ ت ث

0

6/145

0

0

2/0

0

0

0

0

0

0

3/0

0

0

9/0

0

0

0

05/99

ج چ ح خ

0

0

7/142

0

0

0

0

1/0

8/0

0

0

0

0

3

0

0

1/0

0

10/99

د ذ

1/0

0

0

2/72

6/1

0

0

0

0

0

0

1/0

0

0

0

0

0

0

57/97

ر ز ژ

5/0

0

0

1

4/109

0

0

0

0

0

0

1/0

0

0

0

0

0

0

56/98

س ش

0

1/0

0

0

0

5/71

0

0

0

0

1/0

0

0

0

2/0

0

0

1/1

95/97

ص ض

0

0

0

0

0

1/0

7/73

0

0

2/0

0

0

0

0

0

0

0

0

59/99

ط ظ

0

0

0

2/0

0

0

0

5/73

0

2/0

0

1/0

0

0

0

0

0

0

32/99

ع غ

2/0

0

6/0

0

0

0

0

0

2/72

0

0

0

0

0

0

0

0

0

90/98

ف

0

7/0

0

0

1/0

0

4/0

1/0

0

6/36

7/1

4/0

0

0

0

0

0

0

81/90

ق

0

0

0

0

0

0

4/0

0

0

1/1

35

0

0

0

3/0

0

2/0

0

59/94

ک گ

0

7/0

0

1/0

0

8/0

0

2/0

0

0

0

3/69

0

0

0

1/0

0

8/0

25/96

ل

0

0

0

0

1/0

0

0

0

0

0

0

1/0

9/34

0

9/0

0

5/0

5/0

32/94

م

0

0

3/0

0

0

0

0

0

0

0

0

0

0

5/36

0

2/0

0

0

65/98

ن

0

8/0

0

0

0

0

0

0

0

0

0

0

0

0

2/36

0

0

0

84/97

و

0

0

0

0

0

0

0

4/0

1/0

0

0

0

0

0

0

5/37

0

0

69/98

ه

0

0

0

3/0

0

0

0

4/0

0

0

0

0

3/0

0

0

0

35

0

22/97

ی

0

0

4/0

0

7/0

5/0

1/0

0

0

0

0

2/0

0

0

0

1/0

4/0

6/35

68/93

قابلیت

اطمینان(%)

93/98

44/98

10/99

83/97

59/97

08/98

79/98

39/98

77/98

73/95

11/95

16/98

15/99

18/99

03/94

94/98

69/96

68/93

97/97

59/97


4- نتیجه‌گیری

در این تحقیق روشی جدید برای بازشناسی برخط حروف مجزای دست­نویس فارسی ارایه شد. در روش ارایه شده از دانش مربوط به بدنه اصلی حروف و ریزحرکات به‌طور همزمان استفاده شده­است. به این ترتیب که در صورت همخوانی گروه شناسایی شده از بدنه اصلی و ریزحرکات نمونه ناشناخته تشخیص داده می­شود و در غیر این­صورت با استفاده از الگوریتم تصحیح خطا ناهمخوانی پیش­آمده تا حد امکان تصحیح می­گردد. استفاده همزمان از دانش مربوط به بدنه اصلی و ریزحرکات شرایطی را فراهم می­آورد که تصمیم­گیری اولیه و همچنین تصمیم­گیری نهایی برای تعیین کلاس خروجی از اعتبار بیشتری برخوردار باشد. با توجه به نرخ بازشناسی مناسب برای طبقه­بندهای مربوط به بدنه اصلی و ریزحرکات، در صورت همخوانی بین گروه شناسایی شده از بدنه اصلی و ریزحرکات، نرخ بازشناسی اولیه برای تعیین کلاس خروجی میزان قابل توجهی دارد و همچنین تصمیم­گیری با اطمینان بیشتری انجام می­پذیرد. همچنین در صورت بروز ناهمخوانی بین گروه شناسایی شده از بدنه اصلی و ریزحرکات، ناهمخوانی پیش­آمده توسط عملیات پس­پردازش با تکیه بر تصمیم گرفته­شده توسط از یکی طبقه­بندها تاحد امکان تصحیح می­گردد. به نظر می­رسد استفاده همزمان از دانش مربوط به بدنه اصلی حرکت قلم و ریزحرکات برای بازشناسی کلمات و زیرکلمات نیز مفید باشد.

با استخراج ویژگی­های نقطه­ای و استخراج چند ویژگی سراسری و با استفاده از طبقه­بند ماشین بردار پشتیبان (SVM) با رویکرد یک در مقابل یک (OVO) برای طبقه‌بندی بدنه اصلی و ریزحرکات، بازشناسی حروف مجزای دست­نویس فارسی انجام می­شود. نتایج آزمایش­ها حاکی از آن­است که، استفاده از کاهش ابعاد ویژگی برای بدنه اصلی حروف، و به صورت همزمان در نظر گرفتن انواع ریزحرکات نتایج مطلوبتری از نظر سرعت انجام محاسبات و همچنین نرخ بازشناسی نهایی به دنبال دارد.

 



[1] Reliability

[2] Tarbiat Modarres University

[3] Off-line

[4] On-line

[5] Hidden Markov Model

[6] Classification

[7] Support Vector Machine

[8] Decision Tree

[9] Fuzzy

[10] Tablet Digitizer

[11] Preprocessing

[12] Feature Extraction

[13] Dimensionality Reduction

[14] Post Processing

[15] Preprocessing

[16] Feature Extraction

[17] Dimensionality Reduction

[18] star  to end

[19] Principle Component Analysis

[20] Linear Discriminate Analysis

[21] One Versus One

[22] One Versus All

[23] Gaussian Radial Basis Function kernel

[24] Confusion Matrix

[25] Score of Recognition

 

 

 

 

 

 

 

  [1]      Razavi. S. M, Kabir. E, "A Database for Recognition of Farsi Online Handwriting," 6th Iranian Conference on Intelligent Systems (ICIS2004).

  [2]      Razavi. S. M, Kabir. E, "Recognition of Farsi Online Handwriting," Modares Journal of Electrical Engineering, Vol. 17. No 2, pp. 65-82, 2005.

  [3]      Razavi. S. M, Kabir. E, "A Simple Recognition Method for Online Isolated Farsi Characters," Modares Journal of Electrical Engineering, Vol. 17. No 2, pp. 65-82, 2005.

  [4]      Ghods. V, Kabir. E, "A study on usual styles of Farsi online handwriting in order to recognition," Tabriz Journal of Electrical Eng., Vol. 41, No. 1, Serial No. 61, pp. 22-32, 2011.

  [5]      Razavi. S. M, Kabir. E, "Online Recognition of Farsi Handwritten Isolated by Natural Network," The Third Conference on Machine Vision, Image Processing & Applications (MVIP 2005), University of Tehran, Iran, Feb. 23-24, 2005.

  [6]      Sajedi. H, Jamzad M, Sameti. H, Babaali B, "A Grouping-based method for On-Line Persian Discrete Character Recognition Using Hidden Markov Model," 12th. Annual International CSI Computer Conference (CSICC2007), Electrical and Computer Engineering Faculty, Shahid Beheshty University, 20-22 February 2007.

  [7]      Mehralian. M. A, Fouladi. K, "The Recognition of Online Handwritten Persian Characters Based on their Main Bodies Using HMM," 15th. National CSI Computer Conference CSICC, Tehran. Iran, February 2010.

  [8]      Mehralian. M. A, Fouladi. K, "The Recognition of Online Handwritten Persian Characters Based on their Main Bodies Using SVM," Journal Signal and Data Processing, 2013(Issue 1).

  [9]      V. Ghods, E. Kabir, “Feature Extraction for Online Farsi Characters,” 12th. International Conference on Frontiers in Handwriting Recognition, 2010.

[10]      Soleymani. Baghshah, M, Bagheri Shouraki. S, Kasaei. S, "A Novel Fuzzy Classifier Using LVQ to Recognize Online Persian Handwriting," 14th. Iranian Conference on Electrical Engineering (ICEE2006), AmirKabir University, 2006.

[11]      Tagougui, N., Kherallah, M., Alimi, A.M., "Online Arabic Handwriting Recognition: a survey," International Journal on Document Analysis and Recognition (IJDAR), Vol. 16, No 3, pp. 209-226, September 2013.

[12]      Huang, B.Q., Zhang, Y.B., Kechadi, M-T., "Preprocessing Techniques for Online Handwriting Recognition," Seventh International Conference on Intelligent Systems Design and Applications, Rio de Janeiro, pp. 793- 800, 20-24 Oct. 2007.

[13]      Faradji, F., Faez, K., Nosrati, S.M, "Online Farsi Handwritten Words Recognition Using a Combination of 3 Cascaded RBF Neural Networks," International Conference on Intelligent Advanced Systems, Kuala Lumpur, pp. 134-138, 25-28 Nov. 2007.

[14]      Singh, V., Kumar, B., Patnaik, T., "Feature Extraction Techniques for Handwritten Text in Various Scripts: a Survey," International Journal of Soft Computing and Engineering (IJSCE), Vol 3, No 1, pp. 238- 241, March 2013.

[15]      Ghods, V., Kabir, E., "Feature Extraction for Online Farsi Characters," 12th.­ International Conference on Frontiers in Handwriting Recognition, Kolkata, pp. 477- 482, 16-18 Nov. 2010.

[16]      Biem, A., "Minimum Classification Error Training for Online Handwriting Recognition," IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 28, No. 7, pp. 1041-1051, July 2006.

[17]      Harouni, M., Dzulkifli, M., Rasouli, A.; "Deductive Method for Recognition of On-Line Handwritten Persian/Arabic Characters," 2nd International Conference on Computer and Automation Engineering (ICCAE), Singapore, Vol 5, pp. 791-795, 26-28 Feb. 2010.

[18]      Sidaoui, B., Sadouni, K., "OVA Tree Multiclass Framework for support Vector Machine," Proceedings of the International Multi-Conference of Engineers and Computer Scientists, Hong Kong, IMECS, 13-15 March 2013.

[19]      Bahlmann, C., Hassdonak, B., Burkhardt, H., "On-line Handwriting Recognition with Support Vector Machines A Kernel Approach," Eighth International Workshop on Frontiers in Handwriting Recognition (IWFHR), pp. 49-54, 2002.

[20]      T.Al-Tanni, A., Al-Haj, S., "Recognition of On-line Arabic Handwritten Characters Using Structural Features," Journal of Pattern Recognition Research, pp. 23-27, 2010.