بازنمایی گل‌های قالی با استفاده از تبدیل‌های موجک و فوریه-ملین

نوع مقاله: مقاله علمی فارسی

نویسندگان

1 - کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه تربیت مدرس- تهران- ایران

2 - استاد، دانشکده مهندسی برق و کامپیوتر، دانشگاه تربیت مدرس- تهران- ایران

چکیده

در این مقاله، به بازنمایی و توصیف گل‌های قالی می‌پردازیم. مجموعه گل‌های موجود در چهارده کلاس طبقه‌بندی می‌شوند. از آنجایی که گل‌ها دارای چرخش، تغییر مقیاس و انتقال هستند، توصیفگر مطلوب باید نسبت به این تغییرات پایا باشد. در این مقاله از دو توصیفگر موجک و فوریه-ملین استفاده شده است. در توصیفگر موجک از انحراف معیار مقدار عناصر زیرباندها استفاده شده است. برای ارزیابی توصیفگرهای به کار رفته، گل‌ها را بازشناسی می‌کنیم. برای بازشناسی از روش نزدیکترین همسایه استفاده شده که بیشترین نرخ بازشناسی با معیار فاصله مانهاتان به دست آمد. برای روشی که قبلا براساس کانتور گل‌ها و توصیفگر فوریه بوده، نرخ بازشناسی 69.4 درصد گزارش شده است. در روش فوریه-ملین که جزییات داخلی نیز مد نظر بود، نرخ بازشناسی 81.5 درصد حاصل شد.

کلیدواژه‌ها


عنوان مقاله [English]

Representation and Description of Carpet Patterns Using Wavelet and Fourier–Mellin Transforms

نویسندگان [English]

  • Majid khodakarami 1
  • Ehsanollah kabir 2
1 Dept of Electrical and Computer Engineering, Tarbiat Modarres University, Tehran, Iran
2 Dept of Electrical and Computer Engineering, Tarbiat Modarres University, Tehran, Iran
چکیده [English]

In this paper, we study the description and the representation of carpet’s flowers. The available carpet’s flowers set are classified in 14 classes. Since flowers have rotation, scale change and transition, the desirable descriptor should be invariant to this change. In this research we use wavelet descriptor and Fourier-Mellin descriptor. In wavelet descriptor uses the standard deviation of sub-bands. We recognize flowers to evaluate the used descriptors. The nearest neighbor method was used for the recognition and that highest recognition rate was obtained by the manhattan distance criterion. Some flowers segregated with inner details and considered in this research. For a method that is done according to the flower’s Contour and Fourier descriptor, the reported recognition rate is 69.4%, but in Fourier-Mellin method that considers the inner details also, the recognition rate is 81.5%.

کلیدواژه‌ها [English]

  • carpet’s flower
  • Fourier-Mellin transform
  • rug
  • wavelet transform
  • Fourier
  • Mellin transform
  • invariant features
  • binary image

برای انجام پردازش بر روی نقشه قالی، فرض می‌شود که نقشه قالی از ترکیب آرایه­های مختلف تشکیل شده است و از قرار گرفتن این آرایه­ها کنارهم، باغی ایرانی برای نقشه قالی شکل گرفته است. هنگام طراحی نقشه قالی معمولا آن را به چند قسمت تقسیم می­کنند که در شکل (1، یک قسمت از 6 قسمت نقشه یک قالی نشان داده شده است. این نقشه از مجموعه ای از گل‌ها، برگ­ها و شاخه­هایی که آنها را به هم پیوند می­دهند، تشکیل شده است که هریک از این عناصر به تنهایی آرایه خوانده می­شود. در شکل (1نمونه‌هایی از آرایه‌های تشکیل دهنده شکل (1، به صورت جداگانه نشان داده شده است.

چنانچه هریک از این آرایه­ها توسط رایانه شناخته شوند، با استفاده از این شناخت و ترکیب آن با رنگ­های مورد استفاده در قالی و هچنین طرح­های مورد استفاده، می‌توان نقشه قالی را به صورت خودکار تحلیل کرد؛ مثلا می‌توان با داشتن فایل‌های تصویری مختلف نقشه­های قالی ایران مشخص کرد که هر تصویر متعلق به کدام مرکز قالیبافی ایران است و یا با ترکیب آرایه­ها و اضافه کردن و یا جایگزین کردن آن در طرحی از قالی، طرح نو دیگری را به وجود آورد و همچنین، روش­های دیگری که هنگامی که راه شناخت و تحلیل آرایه­ها به صورت خودکار باز شد، می‌توانند ایجاد و استفاده شوند]4[.

 

شکل (1): قسمتی از یک نقشه دستی قالی]4[.

 

 

شکل(2): نمونه‌هایی از آرایه‌های موجود در نقشه قالی شکل (1) الف) شکوفه؛ ب) غنچه؛ ج) شاه عباسی و د)  نیم برگ]4[.

یکی از کاربردهای مهم توصیف تصویر، جستجوی یک تصویر در بین مجموعه تصاویر است. معمولا علاقه مندیم که توصیفگر انتخابی، در مقابل تغییرات مقیاس، چرخش و جابه‌جایی مقاوم باشد. همچنین، روشی که در عین سادگی، توصیف مناسبی برای شکل‌های مورد نظر ما داشته باشد ارجح و برتر است. تبدیل موجک نسبت به چرخش، انتقال و تغییر مقیاس حساس است. برای پایا شدن در مقابل این تغییرات از خروجی تبدیل موجک ویژگی‌های مناسبی استخراج می­شود. از تبدیل فوریه برای حذف اثر انتقال و از تبدیل ملین برای حذف اثر چرخش و تغییر مقیاس استفاده می­شود. این دو تبدیل در کنار هم به اختصار [1]FMT نامیده می­شوند. تئوری این تبدیل در] 12،13 [شرح داده شده است. این روش در مقایسه با روش‌های دیگر کمترین پیش پردازش را نیاز دارد. مجموعه توصیفگر FMT با تبدیل موجک، توصیفگر [2]WFMT نامیده می­شود] 14 [که در این مقاله از آن استفاده می­شود. از تبدیل موجک برای مقاوم شدن در مقابل نویز و اعوجاج استفاده شده است] 14[. همچنین، به علت کاهش ابعاد تصویر توسط تبدیل موجک، سرعت پردازش نیز افزایش می­یابد.

 

1- مروری بر کارهای دیگران

در زمینه بازنمایی گل قالی، غالبی از توصیفگر فوریه بر روی کانتور گل استفاده کرده است]4[. اما در زمینه توصیفگری که شامل جزییات داخلی گل قالی نیز باشد تاکنون کاری انجام نشده است. کارهایی که به نظر می‌رسد بیشترین تشابه را با این کار داشته باشند، بازنمایی لوگو، اثر انگشت، کف دست و از این قبیل است. نمونه ای از گل‌های مورد نظر ما در شکل  نشان داده شده است.

 

 

شکل (3): نمونه گل‌های قالی؛ الف) و د) گل شاه عباسی؛ ب) گل اسلیمی و ج) گل نرگس.

 

کارهایی که روی لوگو انجام شده است، عمدتا دو روش هستند که برخی براساس کانتور هستند که مناسب کار ما نیستند و برخی که بر اساس ناحیه هستند، برای داده‌های ما کارایی ندارند. کاری که از نظر جزییات، بیشترین شباهت را به کار ما دارد، بازنمایی اثر انگشت است و روش کار در این مقاله بر اساس ایده‌هایی است که از روش‌های به کار برده شده برای اثرانگشت گرفته شده است.

یکی از روش‌هایی که برای کار ما مناسب است استخراج ویژگی از زیر باندهای تبدیل موجک است. در سال 2003 هنری سلواراج[3]]18[ از این روش برای بازشناسی اثر انگشت استفاده کرده است. در سال 2001 ماریوس تیکو[4]]20[ با استفاده از موجک­های مختلف و دسته بند  k-NNنرخ بازشناسی نسبتا خوبی به دست آورده است. در سال 2010 سانجکار[5] نیز با استفاده از موجک­ هار از همین روش در بازشناسی اثر انگشت استفاده کرده است]21[.در ]22[ نیز این روش به کار برده شده است.

روش دیگر استفاده از تبدیل موجک و تبدیل فوریه-ملین است. در سال 2008 اسماعیل[6] و رمضان[7] از این روش برای بازشناسی اثر انگشت استفاده کرده اند]23[. در اینجا به جای اینکه در ابتدا از تصویر تبدیل موجک گرفته شود، از خروجی تبدیل فوریه-ملین تبدیل موجک گرفته شده است و در انتها از دسته بند  k-NNبرای دسته بندی استفاده شده است. در سال 2007 نبیل[8] از این روش برای تطابق اثر انگشت استفاده کرده است]24[. همچنین در کنار فوریه-ملین، ویژگی­های انحراف معیار زیر باندهای موجک و انرژی تصویر نیز در بازشناسی به کار برده شده است. نبیل با به کار گرفتن این روش به نرخ بازشناسی نسبتا بالا و سرعت پردازش خوبی دست یافته است. در سال 2003 جین[9] در یک مقاله به طور مفصل این روش را تشریح کرده است]14[. برای بازشناسی نیز از دسته بند  k-NNو فاصله اقلیدسی استفاده شده است. همچنین، در سال 2009، چنگ[10] از تبدیل‌های گابور و موجک برای استخراج بردار ویژگی از اثر انگشت استفاده کرده است]25[.

 

2- معرفی توصیفگرهای انتخاب شده

توصیفگر اول که بر مبنای استخراج ویژگی از زیر باندهای تبدیل موجک است، بدین صورت است که ابتدا تصویر را با استفاده از تبدیل موجک تا چند مرحله تجزیه می­کنیم. در در شکل (4) مراحل تجزیه تا سه مرحله نشان داده شده است.

 

 

 

 

شکل (4):اعمال تبدیل موجک با پایه دابیشی2 بر روی گل قالی تا مرحله سوم.

 

 

پس از تجزیه توسط موجک از زیر باندهای به دست آمده (یعنیLLk , LHk , HLk , HHk  ;در اینجا برای k=1,2,3 ) برای استخراج ویژگی استفاده می‌کنیم. در هر مرحله تعداد چهار زیرباند داریم و اگر تا مرحله jام تصویر را تجزیه کنیم، به تعداد4j  زیر باند می‌رسیم. در هر زیرباند، دو ویژگی میانگین و انحراف معیار زیر‌باند حساب می‌شود و با استفاده از یک دسته بند تصاویر دسته بندی می‌شوند. دیاگرام این روش در شکل  نشان داده شده است.

 

 

شکل (5): استخراج ویژگی با زیر باندهای تبدیل موجک]22[.

 

برای بهبود نرخ بازشناسی می‌توان ماتریس هم رخدادی[11] را برای زیرباند‌هایی که در مرحله اول تجزیه می‌شوند، حساب کرد. چند ویژگی حاصل از ماتریس‌های هم رخدادی مانند بیشینه احتمال[12]، تباین[13]، آنتروپی[14]، انرژی[15]، همگنی محلی[16] و برجستگی خوشه‌ای[17] توسط هارالیک[18] در سال 1973 معرفی شده اند]19[.

روش دیگری که در برابر تغییر مقیاس، چرخش و انتقال مقاوم است، استفاده از توصیفگر فوریه-ملین با موجک (WFMT) است. در این روش، ابتدا تصویر ورودی با استفاده از تبدیل موجک تجزیه می­شود تا ابعاد تصویر، بدون اینکه لبه­های محلی از بین برود، کاهش یابد. همچنین، با این کار، خروجی در مقابل نویز و اعوجاج نیز مقاوم می‌شود. در واقع، تبدیل موجک انرژی را در زیر ناحیه LL فشرده می­کند. سپس از تصویر به دست آمده تبدیل فوریه گرفته می­شود. اندازه تبدیل فوریه در مقابل انتقال پایاست. با انتقال ماتریس اندازه تبدیل فوریه از مختصات کارتزین به مختصات قطبی، چرخش در تصویر به انتقال بر روی محور زاویه تبدیل می­شود و با لگاریتمی کردن محور شعاعی، تغییر مقیاس در تصویر به انتقال عمودی تبدیل می‌شود. در نتیجه، با انتقال به مختصات لگاریتمی- قطبی اثر چرخش و تغییر مقیاس به انتقال افقی و عمودی تبدیل می‌شود. با گرفتن اندازه تبدیل فوریه از خروجی این قسمت اثر انتقال از بین می‌رود. سپس از پشت سر هم قرار دادن سطرهای ماتریس حاصل، بردار ویژگی به دست می‌آید. نمودار مراحل اعمال این توصیفگر بر روی تصویر در شکل   نشان داده شده است.

 

 

 

شکل (6): بلوک دیاگرام تولید ویژگی WFMT بر گرفته از ]19[.

 

 

3- معرفی مجموعه داده

برای تهیه مجموعه گل‌ها، از نقشه‌های دستی قالی، کتاب‌ها و مجلات استفاده شده است. بیشتر این داده­ها از منابع مذکور روبش شده و برخی نیز از روی پشت قالی به صورت دستی کشیده شده­اند. گل­هایی که در دسترس بوده است، مجموعه‌ای است که غالبی آنها را جمع آوری کرده است]4[. در پژوهشی که او انجام داده]4[ جزییات داخلی گل‌ها حذف شده‌اند و تنها کانتور آنها مد نظر بوده است.

به دلیل اینکه پردازش‌های انجام شده روی داده برای به دست آوردن کانتور بوده، این پردازش‌ها برای کار ما مناسب نیست. بنابراین، در این مقاله با توجه به اینکه جزییات داخلی مد نظر است، پردازش‌های مناسب را برای آماده سازی تصاویر انجام می‌دهیم. همچنین، تعدادی گل نیز به مجموعه گل­های جمع آوری شده اضافه شده است.

پس از جمع آوری داده توسط غالبی، با استفاده از نظرهای اساتید قالی، گل‌ها به چند شاخه و زیر شاخه تقسیم شده اند. در شکل  ساختار بندی مجموعه نشان داده شده است. در این ساختار گل‌ها به چهارده زیر شاخه انتهایی تقسیم شده اند. آرایه‌ها به دو بخش اسلیمی و ختایی تقسیم شده است. شاخه اسلیمی دارای سه زیر بخش ماری، ساده و دهان‌اژدری است. شاخه ختایی دارای سه زیر بخش غنچه، برگ و گل‌هاست. زیر بخش غنچه دارای سه زیر بخش سه برگ، دو برگ و تک برگ است. زیربخش برگ دارای سه زیربخش نیمه برگ، کنگری و بادامی است. زیربخش گل‌ها دارای دو زیربخش شاه‌عباسی و گرد است. زیر بخش گل گرد نیز دارای سه زیر بخش گل‌پنج‌پر ، گل نرگس و گل شکوفه است. به این علت که گل‌های غنچه سه برگ دارای دو دسته­ی متفاوت از هم هستند، این گل به دو کلاس تقسیم شد که در نهایت گل­ها به چهارده کلاس تقسیم شدند.

 

 

شکل (7): ساختار بندی مجموعه گل‌های قالی ]4[.

 

برای اینکه گل­ها برای الگوریتم ما قابل استفاده باشند پیش پردازش‌هایی بر روی آنها انجام شده است که در ادامه توضیح داده می‌شوند. برخی از گل‌های مجموعه از نقشه قالی روبش شده اند و به صورت دستی از زمینه قالی جدا شده اند که به نسبت کیفیت پایین تری دارند. در شکل  نمونه این گل‌ها نشان داده شده است. برخی دیگر از عکس­ها رنگی و از کتاب‌ها روبش شده بودند و کیفیت بالاتری دارند که نمونه این گل‌ها در شکل  نشان داده شده است و برخی نیز از مجلات روبش شده اند که خطوط واضحی دارند و رنگی نیستند. چند نمونه از این گل­ها نیز در شکل  نشان داده شده است.

 

 

شکل (8): گل‌های اولیه که از نقشه‌های قالی جدا شده اند.

 

شکل (9): گل‌های رنگی که از کتاب‌ها روبش شده اند.

 

 

شکل (10): گل‌های خاکستری که دارای لبه‌های واضحی هستند و از مجلات روبش شده‌اند.

 

به این علت که عکس‌ها از منابع مختلف جمع آوری شده‌اند، اندازه آنها با هم یکی نیست. از آنجایی که در این مقاله بر روی خود تصویر کار می­شود، برای استخراج ویژگی نیاز است عکس­ها هم اندازه باشند. به همین علت، در ابتدا اندازه تمام عکس­های اصلی روبش شده، به 256x256 تبدیل شد و در مرحله بعد گل­های رنگی نیز به خاکستری تبدیل شدند.

در مرحله بعد، گل‌های بدون لبه­های مشخص، خطوط خیلی کم رنگ و زمینه­های شطرنجی برخی از عکس‌ها اصلاح شد که قسمت‌هایی از آن با تنظیم روشنایی و فیلتر کردن و قسمت‌هایی که خیلی خراب بودند، به طور دستی درست شدند. تا این مرحله گل‌ها خاکستری هستند و دارای نویز و لبه‌های اضافی هستند. همچنین، سطح روشنایی همه گل‌ها یکنواخت نیست. در این مرحله نیاز است که گل­ها باینری شوند. پس از نویز زدایی، گل­ها با آستانه گیری ساده باینری شدند. در شکل خروجی این مرحله نشان داده شده است که تصویر ورودی برای توصیفگر ماست.

 

 

شکل (11): گل‌ها پس از تبدیل شدن به باینری برای 14 کلاس

 

از تعداد نمونه موجود برای هر کلاس، نیمی از آنها به عنوان نمونه‌های یادگیری و نیمی دیگر به عنوان نمونه‌های آزمایش در نظر گرفته شده اند. در جدول تعداد نمونه‌های مربوط به هر آرایه، برای این مجموعه داده نشان داده شده است. برخی از گل‌ها تنوع کمتری دارند و برخی نیز مانند گل شاه‌عباسی از تنوع بیشتری برخودارند و به همین جهت نمونه­های بیشتری از آن تهیه شده است.

 

جدول (1): تعداد نمونه‌های موجود از هر آرایه

آرایه

تعداد نمونه یادگیری

تعداد نمونه آزمایش

اسلیمی ماری

14

16

اسلیمی ساده

19

18

اسلیمی دهان‌اژدری

10

11

غنچه سه برگ1

26

26

غنچه سه برگ2

22

22

غنچه دوبرگ

11

11

غنچه تک برگ

10

10

نیمه برگ

25

27

برگ کنگری

26

29

برگ بادامی

26

28

گل شاه‌عباسی

134

146

گل پنج‌پر

14

16

گل نرگس

10

11

شکوفه

26

34

مجموع

373

405

4- نحوه بازنمایی و بازشناسی

برای بازنمایی، از توصیفگرهای موجک و WFMT استفاده می­کنیم. همچنین برای به دست آوردن میزان کارایی توصیفگر از بازشناسی استفاده می­کنیم. برای بازشناسی ابتدا برای هر کلاس چند نماینده انتخاب می­شود و به ورودی توصیفگر داده می­شود و خروجی حاصل از توصیفگر در پایگاه داده ذخیره می­شود. نماینده­ها از نمونه­های یادگیری انتخاب می­شوند. پس از اینکه پایگاه داده آماده شد، از نمونه­های آزمایش نیز به توصیفگر داده می­شود و خروجی آن با پایگاه داده مقایسه می­شود و به هر کلاسی که نزدیک بود، به آن کلاس تخصیص می‌دهیم. برای ارزیابی نرخ بازشناسی از K-NN استفاده شد که بیشترین نرخ بازشناسی با معیار فاصله مانهاتان به دست آمد. برای K>2، هر کلاس که بیشترین تخصیص را داشت به آن کلاس تعلق می‌گیرد و اگر دو کلاس به تعداد مساوی امتیاز آوردند کلاسی که میانگین فاصله کمتری دارد گل به آن اختصاص می‌یابد.

برای انتخاب نماینده به صورت زیر عمل میکنیم. ابتدا نمونه­های یادگیری هر کلاس را با استفاده از الگوریتمK-Means  به چند خوشه تقسیم می‌کنیم و اگر فاصله مرکز دو خوشه، از دو برابر فاصله دورترین داده خوشه کمتر باشد آن دو خوشه را یکی می­کنیم، تا جایی که مراکز خوشه­ها به اندازه کافی از هم فاصله داشته باشند. سپس از هر خوشه نمونه­ای را که به میانگین نمونه­های آن خوشه نزدیکتر است، به عنوان نماینده آن خوشه در نظر می­گیریم و نماینده خوشه­ها را به عنوان نماینده­های آن کلاس در هنگام بازشناسی در نظر می­گیریم. در نتیجه هر کلاس بیش از یک نماینده دارد. با این روش نماینده­های مناسب برای هر کلاس انتخاب می­شود که در شکل  نشان داده شده‌اند.

 

شکل (12): نماینده های انتخاب شده و تعداد آنها

 

دیاگرام نحوه بازنمایی نشان داده شده است. در شکل نیز دیاگرام نحوه بازشناسی نشان داده شده است. همان طور که نشان داده شده است، ابتدا نماینده‌ها انتخاب می‌شوند و سپس دسته­بندی انجام می‌شود.

 

 

شکل (13): نحوه بازنمایی

 

 

شکل (14): نحوه بازشناسی

 

5- نتایج بازنمایی و بازشناسی

برای بازنمایی از دو روش که شرح داده شد، استفاده شده است. همچنین، برنامه های این دو روش در محیط نرم افزار متلب پیاده سازی شد و نتایج آن در ادامه توضیح داده می‌شود.

5-1- نتایج بازشناسی با توصیفگر موجک (روش اول)

همان­گونه که گفته شد، چنانچه از تصویر، تبدیل موجک بگیریم و در هر مرحله انحراف معیار زیرباندهای آن را محاسبه کنیم و در یک بردار قرار دهیم، در نهایت یک بردار ویژگی به دست می­آید که چون انحراف معیار است، نسبت به تغییرات مقیاس، چرخش و انتقال پایاست. همچنین، نوع موجک انتخاب شده و تعداد مراحل تجزیه، نرخ بازشناسی را تغییر می­دهد. به دلیل اینکه گل­ها از منابع مختلف تهیه شده­اند، خطوط برخی از آنها ضخیم و برخی نازک هستند، ولی چون در ورودی توصیفگر از زیرباند هموار شده تبدیل موجک استفاده می‌شود که در واقع خروجی فیلتر پایین­گذر است، خطوط هموار می­شوند. همچنین، از لبه یاب سوبل نیز برای لبه یابی استفاده شد که نرخ بازشناسی را بهبود داد. در شکل دیاگرم دسته بندی با موجک نشان داده شده است.

 

شکل (15): دیاگرام دسته­بندی با موجک

 

اگر یک مرحله تجزیه کنیم، بردار ویژگی چهار تایی خواهد شد و نرخ بازشناسی کم خواهد شد. برای بزرگتر از پنج مرحله نیز نرخ بازشناسی کم خواهد شد. بیشترین نرخ بازشناسی با چهار مرحله به دست آمد که در نرخ بازشناسی به ازای موجک‌های مختلف نشان داده شده است. همچنین، بهترین پایه موجک که بالاترین نرخ بازشناسی را می‌دهد، دابیشی8 است.

 


 

جدول(2): نرخ بازشناسی با ویژگی انحراف معیار موجک در چهار مرحله تجزیه(به درصد).

Sym4

Db8

Db4

Db2

Haar

آرایه‌ها

شماره کلاس

87.5

87.5

75

68.7

68.7

اسلیمی ماری

1

66.6

88.8

83.3

83.3

77.7

اسلیمی ساده

2

81.8

63.6

81.8

72.7

45.4

اسلیمی دهان‌اژدری

3

38.4

46.1

38.4

38.4

30.7

غنچه سه برگ 1

4

50

54.5

59

77.2

27.2

غنچه سه برگ 2

5

72.7

81.8

81.8

54.5

36.3

غنچه دوبرگ

6

40

20

20

10

10

غنچه تک برگ

7

33.3

37

44.4

18.5

40.7

نیمه برگ

8

68.9

72.4

68.9

72.4

89.6

برگ کنگری

9

100

100

100

100

100

برگ بادامی

10

97.9

95.2

96.5

95.8

97.2

گل شاه‌عباسی

11

75

62.5

75

68.75

62.5

گل پنج‌پر

12

45.4

54.5

45.4

27.2

54.5

گل نرگس

13

67.6

73.5

58.8

41.1

47

گل شکوفه

14

76.0

76.8

76.0

71.6

71.1

نرخ بازشناسی کل

 

 

 

5-2- نتایج بازشناسی با فوریه - ملین (روش دوم)

دیاگرام این روش در شکل  نشان داده شده است. در اینجا از توصیفگر  WFMTاستفاده شد. میزان نرخ بازشناسی برای موجک­های مختلف آزمایش شد و بهترین نتیجه با موجک خانواده دابیشی2 به دست آمد که نرخ بازشناسی به 81.5 درصد رسید. همان‌طور که مشاهده می‌شود، نرخ بازشناسی برای پایه­های موجک مختلف، متفاوت است. در جدول نرخ بازشناسی به ازای موجک‌های مختلف نشان داده شده است.

 

 

جدول (3): نرخ بازشناسی توصیفگر فوریه-ملین بر پایه­های موجکمختلف در سطح3 (به درصد).

Bior3.1

Sym4

Db4

Db2

Haar

بدون موجک

آرایه­ها

شماره کلاس

56.2

43.7

43.7

43.7

50.0

25.0

اسلیمی ماری

1

55.5

66.6

77.8

61.1

72.2

66.6

اسلیمی ساده

2

45.4

63.6

63.6

90.9

72.2

63.6

اسلیمی دهان‌اژدری

3

34.6

88.4

69.2

84.6

80.7

61.5

غنچه سه برگ 1

4

50.0

72.7

63.6

63.6

63.6.5

59.1

غنچه سه برگ 2

5

18.2

54.5

54.5

72.7

54.5

36.4

غنچه دوبرگ

6

30.0

60.0

50.0

50.0

60.0

40.0

غنچه تک برگ

7

22.2

33.3

51.8

51.8

44.5

37.0

نیمه برگ

8

55.1

82.7

79.3

82.8

79.3

70.0

برگ کنگری

9

100

96.4

96.4

89.3

99.5

92.8

برگ بادامی

10

89.0

93.1

93.1

98.6

95.2

94.5

گل شاه‌عباسی

11

43.7

62.5

68.7

62.5

75.0

75.0

گل پنج‌پر

12

36.3

63.6

72.7

63.6

72.7

72.7

گل نرگس

13

97.0

63.6

88.2

85.3

82.3

91.2

شکوفه

14

67.4

78.2

79.0

81.5

80.4

75.3

نرخ بازشناسی کل

 


 

 


6- بررسی نتایج

در Error! Not a valid bookmark self-reference.نتایج نرخ بازشناسی برای توصیفگرهای استفاده شده، نشان داده شده است. همچنین، در هر سه روش، دسته بندی به یک شکل انجام گرفته است.

 

7- خطاها

ماتریس سردرگمی نمایش خوبی از خطاها را نشان می‌دهد. در Error! Reference source not found. ماتریس سردرگمی برای توصیفگر موجک و در Error! Reference source not found. ماتریس سردرگمی برای توصیفگر فوریه-ملین نشان داده شده است.

گل­هایی که با هم اشتباه می­شوند در بخش زیر آورده شده­اند. سایر خطاها تا حدودی متفرقه هستند.

 

 

جدول (4) مقایسه نرخ بازشناسی

روش دوم : توصیفگر فوریه-ملین

روش اول : توصیفگرموجک با انحراف معیار

توصیفگر فوریه بر اساس کانتور[4]

روش

تصویر 32 * 32

16

64

تعداد ویژگی

81.5

76.8

69.4

نرخ بازشناسی

 

جدول (5) ماتریس سردرگمی برای توصیفگر موجک

شکوفه

گل نرگس

گل پنج‌پر

شاه ‌عباسی

برگ بادامی

برگ‌کنگری

نیمه برگ

تک برگ

دو برگ

سه برگ 2

سه برگ 1

دهان‌اژدری

ساده

ماری

آرایه ها

.

.

.

1

.

.

.

.

.

.

.

.

1

14

ماری

.

.

1

.

.

.

.

.

.

.

.

1

16

.

ساده

.

.

.

.

.

.

.

.

.

.

.

7

3

1

دهان‌اژدری

6

0

2

.

.

.

2

1

1

1

12

1

.

.

سه برگ 1

1

.

.

.

.

1

1

5

.

12

2

.

.

.

سه برگ 2

.

.

.

.

.

1

.

1

9

.

.

.

.

.

دوبرگ

3

.

.

.

.

.

.

2

.

3

2

.

.

.

تک برگ

2

.

.

.

.

1

10

5

.

8

1

.

.

.

نیمه برگ

.

.

2

.

.

21

5

.

.

1

.

.

.

.

برگ کنگری

.

.

.

.

28

.

.

.

.

.

.

.

.

.

برگ بادامی

.

4

.

140

.

.

.

.

.

.

.

1

.

1

شاه‌عباسی

1

2

10

.

.

1

.

.

1

.

1

.

.

.

گل پنج‌پر

2

6

.

.

.

1

.

.

1

.

.

1

.

.

گل نرگس

25

.

1

.

.

.

4

.

.

.

4

.

.

.

شکوفه

 

جدول (6) ماتریس سردرگمی برای توصیفگر فوریه-ملین

شکوفه

گل‌نرگس

گل‌پنج‌پر

شاه‌عباسی

برگ‌بادامی

برگ‌کنگری

نیمه‌برگ

تک برگ

دو برگ

سه برگ 2

سه برگ 1

دهان ‌اژدری

ساده

ماری

آرایه ها

.

.

.

7

.

1

.

.

.

.

.

1

.

7

ماری

.

1

.

1

.

2

.

.

.

.

1

1

11

1

ساده

.

.

.

.

.

.

.

.

.

.

.

10

1

.

دهان‌اژدری

1

.

3

.

.

.

.

.

.

.

22

.

.

.

سه برگ 1

1

.

.

.

.

.

2

3

.

14

2

.

.

.

سه برگ 2

.

.

.

.

.

.

.

.

8

3

.

.

.

.

دوبرگ

.

.

.

.

.

.

.

5

.

4

1

.

.

.

تک برگ

.

.

.

.

6

2

14

2

1

1

1

.

.

.

نیمه برگ

.

.

.

.

.

24

2

.

.

2

1

.

.

.

برگ کنگری

.

.

.

.

25

.

3

.

.

.

.

.

.

.

برگ بادامی

.

.

2

144

.

.

.

.

.

.

.

.

.

.

شاه‌عباسی

5

1

10

.

.

.

.

.

.

.

.

.

.

.

گل پنج‌پر

4

7

.

.

.

.

.

.

.

.

.

.

.

.

گل نرگس

29

1

4

.

.

.

.

.

.

.

.

.

.

.

شکوفه


7-1- خطاهای اسلیمی ماری

عمده خطاهای این گل مربوط به شاه عباسی است و دلیل این خطا این است که گل ماری مانند شاه عباسی جزییات داخلی زیادی دارد. گاهی خطاهای متفرقه دیگری نیز در این کلاس مشاهده می­شود. در شکل(12 چند نمونه اسلیمی ماری نشان داده شده که در کلاس گل شاه عباسی قرار گرفته است.

 

شکل(12): نمونه‌های اسلیمی ماری که در کلاس گل شاه عباسی قرار گرفته است.

 

7-2-  خطاهای غنچه سه برگ نوع1

خطا­های این گل عمدتا در شکوفه جای می­گیرد و علت آن این است که گل سه برگ، 3 تا پره و2 گلبرگ دارد که شبیه به 5 پره شکوفه می­شود. در شکل(13 نمونه‌هایی که به اشتباه در کلاس گل شکوفه قرار می­گیرند، نشان داده شده‌اند. سایر خطاها متفرقه هستند.

 

شکل(13): نمونه غنچه‌های سه برگ نوع1 که در کلاس گل شکوفه قرار می­گیرند.

 

7-3- خطاهای نیمه برگ

خطاها در این کلاس متفرقه هستند، ولی عمده آنها مربوط به کلاس بادامی می­شوند. البته، دلیل این خطا این است که برخی از شکل‌های گل نیم برگ صاف هستند و کاملا شبیه به بادامی می­شوند .

در حقیقت، گل نیم برگ باید مانند شکل (14الف باشد، ولی در مجموعه داده برخی از شکل‌ها مانند شکل (14ب هستند که با کلاس بادامی اشتباه می­شوند.

 

 

شکل (14): نیمه برگ الف درست و نیمه برگ ب در کلاس بادامی قرار می­گیرد.

 

7-4-  خطاهای گل شاه عباسی

به علت جزییات داخلی زیاد، این کلاس با بقیه کلاس­ها متمایز است. همچنین، تعداد نمونه­های این کلاس بسیار بیشتر از بقیه است و به این دو دلیل در این کلاس خطای کمتری رخ می­دهد. برای برخی از شکل‌ها که جزییات داخلی کمتری دارند و شکل خلوت است ، گل به گروه پنج پر و یا به نرگس تعلق می­گیرد.

 

7-5- خطاهای گل پنج پر

از گل­های این مجموعه، تعدادی از آنها در کلاس شکوفه قرار گرفته است. علت این خطا این است که گل 5 پر و شکوفه هر دو 5 تا پره دارند و اختلاف آنها تنها در خمیدگی روی پره­های آن است و در برخی موارد کاملا شبیه به هم هستند. شکل(15 یک نمونه از گل­های شکوفه و پنج پر که با هم اشتباه می­شوند، نشان داده شده است.

 

شکل(15): گل پنج پر و شکوفه که با هم اشتباه می­شوند.

 

به علت منابع متفاوت برای جمع‌آوری گل‌ها، گاهی اوقات در طرح‌های مختلف این پره‌ها شبیه به هم می‌شوند که در این موارد باعث اشتباه شدن آنها می­شود.

 

7-6-  خطاهای گل نرگس

خطا در این کلاس عمدتا به کلاس پنج پر و شکوفه تعلق می­گیرد. در کل، گل نرگس و شکوفه و پنج پر خیلی به هم شبیه هستند و به آسانی باهم اشتباه می­شوند. همان طور که مشاهده می­شود، گل نرگس به شکوفه و پنج پر بسیار شبیه است. در شکل (6 یک نمونه از این سه کلاس نشان داده شده است.

 

شکل (6): یک نمونه از گل پنج پر، گل نرگس و گل شکوفه شبیه به هم

 

8- نتیجه‌گیری

در این مقاله در جستجوی توصیفگری بودیم که بتواند گل­های قالی را به گونه­ای بازنمایی کند که نسبت به تغییرات مقیاس، چرخش و انتقال پایا باشد. دو توصیفگر برای این کار انتخاب شدند که یکی بر اساس ویژگی انحراف معیار زیر باندهای موجک و دیگری براساس طیف توصیفگر فوریه-ملین است. با قرار دادن موجک به عنوان پیش پردازش در توصیفگر فوریه نرخ بازشناسی نسبتا خوبی به دست آمد. برای دسته بندی نیز، فاصله مانهاتان به کار برده شد. از آنجایی که داده‌ها به دو بخش آزمایش و یادگیری تقسیم شد، برای انتخاب نماینده از میان داده‌های یادگیری، از الگوریتمK-Means  استفاده شد. به علت کیفیت پایین برخی از داده­های مجموعه، نیاز به پیش پردازش­هایی است که به صورت ماشینی و در مواردی به صورت دستی انجام شدند. در مورد خطاهایی که در دسته بندی پیش می­آید، نکته قابل توجه این است که عمده خطاها در بین آرایه­هایی پیش می­آید که در یک شاخه قرار گرفته­اند. برای مثال، گل پنج پر، گل نرگس و گل شکوفه در شاخه گل­ها قرار گرفته­اند و خطاهای این سه آرایه عمدتا مربوط به همدیگر است. از آنجایی که شکل گل­ها دارای جزییات داخلی متفاوت است( بدین معنی که برخی دارای جزییات زیاد و برخی دارای جزییات کم هستند) چنانچه بتوان از ترکیب توصیفگر­ها استفاده کرد، احتمالا نرخ بازشناسی بالاتری به دست می­آید. همچنین، به علت اینکه داده­ها از منابع مختلفی جمع آوری شده است، کیفیت گل­ها متفاوت است. به نظر می­رسد اگر روش‌هایی برای پیش پردازش این گل­ها توسعه داده شود که مراحل دستی حذف شود، این روش‌های بازنمایی می­تواند در عمل نیز به کار گرفته شود.



[1] Fourier–Mellin Transform

[2] Wavelet Fourier–Mellin Transform

[3] Henry Selvaraj

[4] Marius Tico

[5] Sanjekar

[6] Ismail

[7] Ramadan

[8] Nabeel

[9] Jin

[10] Cheng

[11] co-occurrence

[12] maximum probability

[13] contrast

[14] entropy

[15] energy

[16] local homogeneity

[17] cluster prominence

[18] R.M.Haralick

]1[    مجید خداکرمی " استفاده از تبدیل­های موجک و فوریه-ملین در بازنمایی و توصیف گل­های فرش " پایان نامه کارشناسی ارشد، دانشکده برق و کامپیوتر، دانشگاه تربیت مدرس، 1390.
]2[     احمد ایزدی پور "خواندن خودکار نقشه چاپی فرش" پایان نامه کارشناسی ارشد، دانشکده برق و کامپیوتر، دانشگاه تربیت مدرس، 1386.
]3[     فاطمه شیری "آشکارسازی خودکار خطوط در نقشه­های چاپی و دستی" پایان نامه کارشناسی ارشد، دانشکده برق و کامپیوتر، دانشگاه تربیت مدرس، 1389.
]4[     حمیده غالبی "بازشناسی خودکار گل­های قالی با تاکید بر توصیفگرهای شکل" پایان نامه کارشناسی ارشد، دانشکده تحصیلات تکمیلی، دانشگاه آزاد اسلامی تهران جنوب، 1390.
[5] Dengsheng Zhang, Guojun Lu “Review of shape representation and description techniques”, Pattern Recognition Society. Vol. 37. pp. 1-19. July. 2003.
[6] M. Bober, "MPEG-7 visual shape descriptors," Circuits and Systems for Video Technology, IEEE Transactions on, Vol.11, No.6, pp.716-719, Jun. 2001.
[7] D. Zhang, “Image Retrieval Based on Shape”. A Dissertation for the Degree of Doctor of Philosophy, Submitted in Partial Fulfillment In the Faculty of Information Technology Monash University. March, 2002.
[8] F. Mokhtarian, A. K. Mackworth, “A Theory of  Multiscale, Curvature-Based Shape Representation  for Planar Curves” IEEE Transactions  On  Pattern Analysis And Machine Intelligence, Vol. 14, No. 8, pp. 789 – 805, August.  1992.
[9] H. Freeman, “Shape  Description  Via  The  Use  Of Critical  Points”. Pattern Recognition, Vol. 10, pp. 159-166, January. 1978.
[10]         B. Wang, Ch. Shi, “Shape Matching Using Chord-Length Function”. Corchado et al. (Eds.): IDEAL 2006, LNCS 4224, pp. 746–753, 2006.
[11]         Y.Mingqiang, K.Kidiyo, R.Joseph”A survey of shape feature extraction techniques",  Pattern Recognition Techniques, Technology and Applications,  pp. 43-90,  2008.
[12]         S. Derrode, F. Ghorbel, “Robust and Efficient Fourier–Mellin Transform Approximations for Gray-Level Image Reconstruction and Complete Invariant Description”, Academic Press , April. 2001.
[13]         P. L. BUTZER, S. JANSCHE, “Mellin-Fourier Series and the Classical Mellin Transform”, Computers and Mathematics with Applications Elsevier, Vol. 40, pp. 49-62, July. 2000.
[14]         A.T.B Jin, D.N.C. Ling, O.T. Song “An efficient fingerprint verification system using integrated wavelet and Fourier–Mellin invariant transform” Image and Vision Computing Elsevier, Vol. 22, pp. 503–513, June. 2004.
[15]         J. Wood, “Invariant  Pattern  Recognition:  A Review”, Pattern Recognition Society, Vol. 29, January. 1996.
[16]         G. Y. Chen, T.D. Bui, A. Krzyzak, "Palmprint Classification using Dual-Tree Complex Wavelets," Image Processing, 2006 IEEE International Conference on, pp.2645-2648, Oct. 2006.
[17]         B.D. Patil, J.V. Kulkami, R.S. Holambe, "Fingerprint Verification Using Wavelet And Local Dominant Orientation," Visual Information Engineering, 2006. VIE 2006. IET International Conference on, pp.79-82, Sept. 2006.
[18]         H.Selvaraj, S. Arivazhagan, L. Ganesan, “Fingerprint Verification Using Wavelet Transform”, Proceedings of the Fifth International Conference on Computational Intelligence and Multimedia Applications (ICCIMA’03) 2003 IEEE, Vol. 2, pp. 281-285, 2007.
[19]         R.M.Haralick, K.Shanmugam, I.Dinstein, “Texture features for image classification”, IEEE transactions on System, Man, Cybernatics, Vol.8, No.6, pp.610-621, 1973.
[20]         M. Tico, E. Immonen, P. Ramo, P. Kuosmanen, J.Saarinen, “Fingerprint Recognition Using Wavelet Features” IEEE International Symposium on Circuits and Systems, Vol. 2, pp. 21-24, May. 2001.