Document Type : Research Article
Authors
Department of Electrical Engineering, University of Birjand, Birjand, Iran
Abstract
Keywords
[1]در طراحی یک سیستم تشخیص الگو پس از انجام مراحل مربوط به اخذ داده، عملیات پیش پردازش و استخراج ویژگی نوبت به استفاده از یک طبقهبندی کننده میرسد که با استفاده از بردارهای ویژگی توابع تصمیم[1] را یافته، فضای ویژگی را به نواحی مختلفی که هر یک از آنها متعلق به یک کلاس خاص است، تقسیم کند. طبقهبندی کنندههای متنوعی برای استفاده در سیستمهای بازشناسی الگو مطرح شده است که از میان آنها میتوان به طبقهبندی کنندههای بیز، k- نزدیکترین همسایه[2]، شبکه عصبی و فازی[3] اشاره کرد. در کنار این طبقهبندی کنندهها، انواع دیگری نیز بر اساس روشهای هوش جمعی و تکاملی پیشنهاد شدهاند (]1[-]3[).
پیشینه طراحی طبقهبندی کنندههای مبتنی بر روشهای جمعی چندان طولانی نیست و موضوعی است که به تازگی توجه محققان حوزه بازشناسی الگو را به خود معطوف کرده است. در گام نخست این پژوهشها، یک «طبقهبندی کننده گروه ذرات[4]» طراحی و با اِعمال آن بر روی دادههای آزمایشی، نشان داده شد که طبقهبندی کننده مذکور دارای نرخ تشخیص قابل مقایسه (و گاه بهتر) از طبقهبندی کننده شبکه عصبی و k- نزدیکترین همسایه است]1[. در مرحله بعد با افزودن یک کنترل کننده فازی به طبقهبندی کننده مذکور نوع کارآمدتر آن به نام «طبقه بندیکننده هوشمند گروه ذرات» معرفی شد]2[. نتایج عملی نشان داد که این طبقهبندی کننده با تعداد تکرار کمتر حلقه اصلی جستجو، قادر به تشخیص صحیح تعداد بیشتری از الگوهای ناشناس است. همین رهیافت با به کارگیری نوع جدیدتری از روش هوش جمعی در ]3[ تجربه شد و نرخ بازشناسی بالاتری نیز به دست آمد. همه این تحقیقات گامهای متوالی برای بهبود طبقهبندی کنندههای نوظهور مبتنی بر روشهای هوش جمعی به شمار میروند.
پژوهشهای اشاره شده دارای نکات مشترکی به شرح زیر هستند:
- در همه تحقیقات فوقالذکر تنها ملاکی که مبنای ارزیابی عملکرد طبقهبندی کننده طراحی شده، «نرخ تشخیص صحیح[5]» است. این در حالی است که شاخصهای مهم دیگری نیز وجود دارند که میتوانند در ارزیابی عملکرد یک طبقهبندی کننده به همان اندازه و حتی بیش از آن حائز اهمیت باشند. شاخصهایی مانند «قابلیت اطمینان[6]» که میزان اعتبار تصمیم یک طبقهبندی کننده را تعیین میکند، مثال بارزی از این شاخصهاست. باید دانست که در بسیاری از موارد ممکن است «نرخ تشخیص» صحیح الگوهای یک کلاس در یک طبقهبندی کننده مقدار در خور توجهی باشد، اما «قابلیت اطمینان» آن طبقهبندی کننده در خصوص همان کلاس چندان زیاد نباشد. این حالت بیشتر در مواقعی رخ میدهد که نمونههایی از کلاسهای دیگر در ناحیه متعلق به کلاس مذکور حاضر میشوند. عکس این موضوع نیز صادق است؛ یعنی مواردی پیش میآیند که در آن «نرخ تشخیص» کم است، اما اعتبار یا «قابلیت اطمینان» به تصمیم اتخاذ شده زیاد است.
- تعداد ابرصفحه[7] های لازم برای تقسیم بندی فضای ویژگی در همه تحقیقات یاد شده به عنوان یک پیش فرض و با سعی و خطا به دست آمده است. بی تردید با به کار گیری تعداد زیادی از ابرصفحهها، الگوهای «آموزشی» با دقت بیشتری طبقهبندی میشوند، اما در غالب اوقات چنین دقتی در مواجهه با دادههای آزمایشی به دست نمیآید. این پدیده «فوق-برازش[8]» یا «فوق-آموزش[9]» خوانده میشود و به عنوان یک پارامتر نامطلوب در طبقهبندی کنندهها به شمار میرود.
نتیجه جستجوی مؤلفان برای یافتن تحقیقاتی که در بردارنده طبقهبندی کنندههای مبتنی بر روشهای هوش جمعی باشند و ضمنا ایرادات فوق را هم مرتفع کرده باشند، نشان داد که در سال 1385 ، یک طبقهبندی کننده چند هدفه با استخدام روش بهینه سازی گروه ذرات، گزارش شده است ]18[ .
کاستیهای فوقالذکر به همراه محدودیت پژوهشهای انجام گرفته در موضوع مورد نظر از یک سو، و حضور روشهای نوین هوش جمعی از سوی دیگر، انگیزههای قوی برای طراحی و معرفی نوع جدیدی از طبقهبندی کنندههای هوش جمعی چند هدفه به شمار میروند.
اخیرا عضوی جدید از روشهای هوش جمعی با نام « الگوریتم بهینه سازی نیروی مرکزی» (CFO) معرفی شده است که مکانیزم آن بر مبنای تاثیر نیروهای نیوتنی بر اجرامی است که در فضای جستجو به عنوان پاسخهای احتمالی مسئله پراکندهاند. این روش توانایی خود را در بهینه سازی توابع محک بسیار پیچیده و همچنین، در مواجهه با مسایل دشوار کاربردی نشان داده است ]7[.
در این تحقیق، ابتدا نسخه «بهینه سازی چند هدفه» مربوط به« الگوریتم بهینه سازی نیروی مرکزی» با عنوان "[10]MOCFO" معرفی میشود. در مرحله بعد، با استفاده از روش بهینه سازی چند هدفه پیشنهادی، طبقه بندی کننده چند منظورهای به نام « طبقهبندی کننده چند هدفه نیروی مرکزی» "MOCFO-classifier" پیشنهاد شده است که به طور همزمان به بهینه سازی سه پارامتر زیر میپردازد:
1- تعداد نقاط آموزشی که توسط ابرصفحههای معرفی شده به وسیله هر «عامل» از «جمعیت» به اشتباه طبقهندی میشود.
2- تعداد ابرصفحههای لازم برای تقسیم بندی مناسب فضای ویژگی و تخصیص هر منطقه به یک کلاس خاص.
3- قابلیت اطمینان تصمیمات اتخاذ شده در خصوص تعلق یک الگو به یک کلاس.
دو مسأله معروف طبقه بندی «دادههای گلهای زنبق» و «دادههای مایعات شیمیایی» در کنار مسأله کاربردی و پیچیده طبقهبندی «اهداف رادار»، سه موضوع انتخاب شده برای بررسی عملکرد طبقهبندی کننده پیشنهادی و مقایسه آن با سایر روشهای مشابه هستند. علت انتخاب دادههای مذکور تنوع در ابعاد، تعداد کلاسهای مرجع و تداخل قابل قبول آنهاست.
سازماندهی این مقاله بدین گونه است که: بخش دوم به معرفی روش پیشنهادی بهینه سازی چند هدفه نیروی مرکزی خواهد پرداخت. سپس طبقه بندی کننده پیشنهادی با نام «طبقه بندی کننده چند هدفه نیروی مرکزی » در بخش سوم معرفی خواهد شد. بخش چهار نتایج عملی و مقایسه ای حاصل از حل سه مسأله انتخابی فوق الذکر را در بر دارد. نهایتا بخش پنج با جمع بندی و بحث در خصوص نتایج به دست آمده مقاله را به پایان خواهد رساند.
در این بخش با به کارگیری روش بهینه سازی نیروی مرکزی، روش بهینه سازی چند هدفة تازه ای پایه ریزی میشود. این روش که به نام MOCFO-classifier خوانده میشود، در ادامه در طراحی طبقهبندی کنندههای چند هدفه به کار گرفته خواهد شد. در ابتدا مفاهیم اصلی مربوط به «بهینه سازی چند هدفه» و الگوریتم «بهینه سازی نیروی مرکزی» (CFO) توضیح داده می شود.
نیاز به بهینه سازی همزمان چندین تابع هدف در بسیاری از مسایل واقعی به چشم می خورد. حل این گونه مسایل غالبا به یافتن یک پاسخ یا (احتمالا) مجموعه ای از پاسخها خواهد شد که مقادیر قابل قبولی از توابع هدف را دربر دارد. یک مسأله بهینه سازی با M هدف خاص را در حالت کلی می توان به صورت زیر تعریف کرد:
(1) |
در حالی که شرایط زیر نیز باید رعایت شوند:
(2) |
، i امین تابع هدف، ، j امین محدودیت اِعمال شده از میان J محدودیت به صورت نامساوی و ، k امین محدودیت لحاظ شده از میان K محدودیت معادلهای است. در این صورت مسأله «بهینه سازی چند هدفه» عبارت است از یافتن پاسخی برای x که را بهینه کند.
اغلب اوقات توابع هدف با یکدیگر در مغایرت[11] هستند؛ به گونهای که پاسخ بهینه برای یکی (در صورت وجود) از دید یک یا چند تابع هدف دیگر غیر بهینه است. این واقعیت لزوم یک مصالحه معقولانه بین جوابهای به دست آمده را آشکار میکند. با انجام این مصالحه منطقی، نهایتا پاسخهایی به دست خواهند آمد که بهینه ساز همه توابع هدف نبوده، بلکه ممکن است از دید تک تک آنها جوابهای «نزدیک بهینه» تلقی شوند.
یک مفهوم مهم در روشهای بهینه سازی چند منظوره «تسلط یا چیرگی[12]» است. پاسخ را «مسلط» بر می خوانند؛ اگر شرایط زیر محقق شود:
· پاسخ از دید هیچ یک از توابع هدف از بدتر نباشد.
· پاسخ حداقل در یکی از توابع هدف از بهتر باشد.
تعاریف فوق به نوبه خود به تعریف «بهینگی پَرِتو[13]» منجر میشود. (U مجموعه مرجع همه پاسخهاست) را «بهینه پَرِتو» گویند اگر وتنها اگر هیچ وجود نداشته باشد که «مسلط» بر باشد. مجوعه همه پاسخهای را مجموعه «بهینه پرتو» یا «جبهه پرتو» میخوانند.
روشهای بهینه سازی مختلفی مانند روشهای تکاملی[14]، روش «بهینه سازی گروه مورچگان[15]» و «بهینه سازی گروه ذرات» برای بهینه سازی چند هدفه به کار گرفته شدهاند (برای مثال ]4[-]6[). با توجه به توانایی روش نوظهور «بهینه سازی نیروی مرکزی» در مواجهه با مسایل پیچیده تک هدفه، به نظر میرسد با تعریف یک تابع تجمیعی[16] بتوان آن را برای مواجهه با مسایل چند هدفه نیز به کار بست. توضیحات تکمیلی در ادامه این بخش آمده است.
الگوریتم CFO، یک الگوریتم بهینهسازی هوش جمعی است که توسط ریچارد فورماتو در سال 2007 معرفی شد. این روش برای بهینه سازی توابع تک هدفه و بر مبنای نیروی گرانش بین پروبها (عوامل جستجو) معرفی شده است]7[. با توجه به اینکه هدف اصلی دراین مقاله، بهره گیری از روش CFO برای طراحی طبقهبندی کنندههای چند هدفه است، ابتدا لازم است این روش به گونة بهینه سازی چند هدفه ارتقا پیدا کند. یکی از روشهای ارتقای الگوریتمهای بهینه سازی تک هدفه به چند هدفه، استفاده از تابع تجمیعی است. در این روش همه توابعی که نیاز به بهینه سازی آنهاست در اوزانی (که مجموع آنها واحد است) ضرب میشوند و ترکیب خطی آنها به عنوان یک تابع جدید، که همان تابع تجمیعی است، تعریف میشود. سپس همین تابع روش بهینه سازی انتخاب شده برای بهینه سازی تابع تک هدفة تجمیعی به کار گرفته میشود. بدیهی است مثلا برای مینیمم کردن تابع تجمیعی لازم است کلیه مؤلفههای سازنده آن مینیمم شوند.
برای توضیح بیشتر فرض کنید هدف مینیمم کردن باشد. در این صورت، تابع تجمیعی به صورت زیر تعریف میشود:
(3) |
که در آن ها ضرایب غیر منفی ها بوده، وزن هر یک از توابع هدف را در تابع تجمیعی ( ) نشان میدهند. همان طور که قبلاً اشاره شد . این ضرایب میتوانند در طول فرایند بهینه سازی، ثابت و یا متغیر باشند. اگر ضرایب ثابت فرض شوند، روش تجمیع توابع، «تجمیع وزندار معمولی» (CWA[17]) نامیده میشود و در هر بار اجرای الگوریتم بهینه سازی تنها یک نقطه از جبهه بهینه (همان جبهه پرتو) به دست میآید.
در نوع دیگر، ضرایب به صورت دینامیکی در طی فرایند جستجو و بهینه سازی تغییر میکنند. به این روش «تجمیع وزندار دینامیکی» ([18]DWA) اطلاق میشود. نحوه تغییر ضرایب برای دو تابع هدف، هنگام اجرای الگوریتم از روابط زیر تبعیت میکند:
(4) |
که در آن، فرکانس تغییرات ضرایب، و t تعداد تکرار را نشان میدهد.
با توجه به عملکرد مطلوب روش DWA نسبت به روش CWA ]8و9[ ، در این مقاله از روش اخیر برای تعریف تابع تجمیعی استفاده شده است.
پس به طور خلاصه، برای ارتقای روش CFO تک هدفه به نوع چند هدفه، ابتدا مطابق روابط بالا ضرایب و تابع تجمیعی را تعریف کرده، با استفاده از روش CFO تک هدفه که در قسمت قبل به طور مبسوط توضیح داده شد، به بهینه سازی آن اقدام میکنیم.
در این بــخش با استفاده از ابزار جســتجوی چند منظورهای که در بخش قبل معرفی شد، به طراحی طبقهبندی کنندهای مبادرت میشود که ضمن تخمین ضرایب ابرصفحههای جدا کنندة کلاسهای مختلف قادر به بهینهسازی شاخصهای مهم «نرخ تشخیص صحیح» ، «قابلیت اطمینان» و «تعداد ابرصفحه های لازم» برای مرزبندی موثر کلاسهای متفاوت در فضای ویژگی است. روشهای مختلف استفاده از ابرصفحهها برای جداسازی کلاسهای مختلف در ]10[ آمده است.
در طبقه بندی کنندة پیشنهادی، پروبها آرایههایی از ابرصفحههای جدا کننده کلاسها هستند که در ابتدا کاملا به صورت تصادفی ایجاد میشوند. به عبارت دیگر، هر پروب به شکل تعریف میشود که در آن بردار اوزان i امین ابرصفحه در فضای ویژگی n بعدی و H تعداد ابر صفحههاست. پس هر سطر در یک پروب، در بردارنده ضرایب یک ابرصفحه است و تعداد سطرها بیانگر تعداد ابرصفحههاست. با توجه به اینکه یکی از اهداف مورد نظر در طراحی طبقهبندی کنندة پیشنهادی، یافتن تعداد بهینه ابرصفحههاست، باید توجه داشت که تعداد سطرها (و در نتیجه تعداد ابرصفحهها) متغیر فرض شدهاند. توضیحات تکمیلی در خصوص نحوه اضافه شدن و یا کم شدن تعداد سطرها در ادامه همین بخش خواهد آمد.
3-2- تعریف توابع هدف
در طبقهبندی کنندة جدید لازم است هر یک از شاخصهای مورد نظر به صورت توابع برازندگی مناسبی معرفی شوند تا هنگام پردازش، پروبها به سمت بهترین مقادیر این توابع گرایش پیدا کنند.
الف) نرخ تشخیص صحیح
تابع برازندگی که برای بهینه سازی نرخ تشخیص صحیح معرفی میشود، به شکل زیر است:
(5) |
در رابطه فوق نشاندهنده iامین پروب، تعداد نقاط آموزشی است که توسط به اشتباه طبقهبندی شدهاست، T تعداد کل نقاط آموزش و مقدار تابع برازندگی برای دستیابی به نرخ تشخیص صحیح ماکزیمم است.
ب) قابلیت اطمینان
شکل 1- نرخ تشخیص صحیح کلاس سفید 100% و قابلیت اطمینان آن 83% و نرخ تشخیص صحیح کلاس سیاه 80% و قابلیت اطمینان آن 100% است.
|
|
شکل (1): نرخ تشخیص صحیح کلاس سفید 100% و قابلیت اطمینان آن 83% و نرخ تشخیص صحیح کلاس سیاه 80% و قابلیت اطمینان آن 100% است
میزان قابلیت اطمینان هر کلاس را به صورت زیر تعریف میکنیم:
(6) |
که در آن تعداد کل نقاط آموزشی کلاس i ام است که به وسیله ابرصفحههای موجود درست طبقهبندی شدهاند. تعداد کل نقاط آموزشی است که توسط یک ابر صفحه در ناحیه متعلق به این کلاس قرار گرفته است و قابلیت اطمینان i ام است.
یکی از توابع برازندگی مناسبی که میتوان برای رسیدن به بیشترین قابلیت اطمینان در طراحی طبقهبندی کنندة پیشنهادی یعنی MOCFO-Classifier تعریف کرد، به صورت حاصلضرب قابلیتهای اطمینان به دست آمده برای هر کلاس است:
(7) |
در این رابطه نشان دهنده i امین پروب، قابلیت اطمینان کلاس j ام است که به وسیله پروب به دست آمده است، M تعداد کل کلاسها و مقدار تابع برازندگی بر اساس ملاک قابلیت اطمینان است.
ج) تعداد ابرصفحه ها
یکی از مسایل مهم که لازم است در یافتن توابع تصمیم مورد توجه قرار گیرد، مسأله «فوق-آموزش» یا «فوق- برازش» است. این پدیده عبارت است از استفاده از تعداد توابع تصمیم زیاد با سازماندهی پیچیده به منظور به حداقل رساندن خطای آموزش، در حالی که خطای آزمایش ممکن است مقدار در خور توجهی باشد. این مسأله معمولا ناشی از یک وسواس غیر منطقی در طبقهبندی دادههای آموزشی است؛ به گونهای که برای به حداقل رساندن خطای آموزش طبقهبندی کننده، از توابع تصمیم بیش از اندازه و با جایابیهایی بسیار نزدیک به هم استفاده میشود. واضح است که سازماندهی توابع تصمیم با تعداد زیاد و با موقعیتهایی که نواحی کدگذاری شده به وسیله آنها مناطق کوچک و گاه بسیار محدودی از فضای ویژگی را شامل میشود، نه تنها هیچ تضمینی را در خصوص کاهش «خطای آزمایش» طبقهبندی کننده در بر ندارد، بلکه ممکن است خود، به افزایش آن منجر شود.
آنچه مسلم است، این است که یکی از عوامل مؤثر در بروز مسأله «فوق-آموزش» استفاده بی رویه از تعداد زیاد ابر صفحه ها در طبقه بندی دادههاست. در طراحی طبقهبندی کننده پیشنهادی، «تعداد ابر صفحهها» متغیر فرض شدهاند. همان طور که در بخش (3-1) اشاره شد، پروبها در طبقهبندی کنندة پیشنهادی به شکل کلی تعریف میشوند که در آن بردار اوزان i امین ابرصفحه است. پس هر سطر در یک پروب، در بردارنده ضرایب یک ابر صفحه است و تعداد سطرها بیانگر تعداد ابرصفحههاست. باید دانست برای دستیابی به بهترین تعداد ابر صفحهها تعداد سطرها متغیر فرض شدهاند. به عبارت بهتر، پروبها دارای فرمهایی متغیر از تا هستند؛ به طوری که حداقل تعداد ابرصفحهها (برای M کلاس مجزا) است و حداکثر تعداد ابرصفحهها است و به صورت پیش فرض انتخاب میشود. به این ترتیب، با توابع برازندگی که در روابط (5) و (7) معرفی شدند، میتوان بهترین تعداد ابرصفحهها را برای پیشگیری از مسأله «فوق- آموزش» و «فوق- برازش» تخمین زد. در صورتی که در هنگام تخمین ابرصفحهها، انجام عملیات همزمان روی پروبهایی با تعداد سطرهای متفاوت ضرورت یابد، ابعاد پروبهای با تعداد سطر کمتر را با افزودن تعداد مناسب سطرهای صفر با پروبهای دیگر هم بعد میکنیم.
4- نتایج عملی
در این فصل به گزارش نتایج به دست آمده از حل سه مسأله تشخیص الگو به وسیله طبقهبندی کننده پیشنهادی خود و مقایسه آنها با سایر طبقهبندی کنندههای مشابه میپردازیم.
دو مسئله متداول در تشخیص الگو به همراه یک زمینه خاص کاربردی، مسایل برگزیده در این تحقیق هستند. دو مسأله متداول عبارتند از: طبقهبندی دادههای گلهای زنبق[19] و طبقهبندی دادههای انواع مایعات شیمیایی[20] و مسأله کاربردی خاص عبارت است از: « تشخیص خودکار اهداف رادار [21]» که ذیلا در مورد هریک توضیح میدهیم.
دادههای گلهای زنبق: دادههای گلهای زنبق شامل پنجاه اندازه گیری از چهار ویژگی سه نوع گل زنبق به نامهای Setosa، Versicolor و Vergenica است]11[. این ویژگیها عبارتند از: طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ. بنابراین، در این مسأله سه کلاس موجود است و هرکلاس دارای پنجاه الگو با بردارهای ویژگی چهار بعدی است.
دادههای مایعات شیمیایی: این مجموعه متشکل از آنالیز شیمیایی عناصر رشد داده شده مایعات شیمیایی یکسان در شرایط مساوی است ]12[. بردارهای ویژگی دارای 13 مؤلفه الکل، اسید مالیک (C4H6O5)، اش[22]، میزان الکالین بودن اش، منیزیم، فنل[23] مجموع، فلامانوئیدها[24] ، فنل های غیر فلامانوئیدی ، پرونتوکیانین[25] ، شدت رنگ، مشخصه ظاهری، میزان OD280/OD315 مایعات شیمیایی رقیق شده و پرولین[26] هستند. در مجموع 178 الگو از سه کلاس مجزا در این مجموعه داده وجود دارد.
طبقهبندی خودکار اهداف رادار: طبقهبندی کننده خودکار اهداف رادار، یکی از مسایل کاربردی تشخیص الگو است که هدف از آن تجهیز رادارهای موج پیوسته به سیستمی است که بتوان با آن علاوه بر موقعیت و سرعت هدف به نوع هدف نیز آگاهی پیدا کرد. روشهای متفاوتی به این منظور معرفی شدهاند که از آن جمله میتوان به استفاده از سطح مقطع راداری[27]، فرکانسهای تشدید اهداف، تغییرات قطبش[28] سیگنال الکترومغناطیسی بازگشتی از هدف و مدولاسیون قسمتهای چرخان اهداف بر روی سیگنال ارسالی رادار اشاره کرد که به ترتیب در ]13[، ]14[، ]15[ و ]16[ گزارش شدهاند.
در این تحقیق از روش مدولاسیون قسمتهای چرخان اهداف استفاده شده است. اغلبِ اهداف دارای قسمتهای چرخندهای هستند که بر روی سیگنال سینوسی ارسالی رادار نوعی عمل مدولاسیون انجام میدهند. پره های موتورهای جت، پرههای ملخ هواپیما و پره های هلیکوپتر مثالهایی از قسمتهای چرخان اهداف مختلف هستند.
یک مدل ریاضی با دقت خوب برای شبیه سازی سیگنالهای بازگشتی از قسمتهای چرخان هواپیما در ]17[ پیشنهاد شده است. این مدل، تئوری با استفاده از ویژگیهای توپولوژیک قسمتهای چرخان و برخی پارامترهای دیگر سیگنال برگشتی از هدف را به دست میدهد. با استفاده از این مدل ابتدا سیگنال بازگشتی از 10 هدف مرجع را در زاویـــه دید º20 شبیه سازی میشوند (اهداف مرجع همانهایی هستند که در ]2[ و ]3[ استفاده شدهاند). پـس از نمــــونه برداری از ســــــیگنال شبیه سازی شده و انجام یک سری عملیات پیش پردازش اقدام به اِعمال تبدیل فوریه سریع[29] 128 نقطه ای روی سیگنال حاصل میشود. بردارهای ویژگی در واقع همین بردارهای به دست آمده 128 بعدی به دست آمده از تبدیل فوریه سریع روی سیگنالهای نمونه برداری شده در حوزه زمان هستند.
4-1 نتایج طبقهبندی دادههای مرجع
این بخش شامل نتایج طبقهبندی دادههای گلهای زنبق، مایعات شیمیایی و اهداف رادار به وسیله سه طبقهبندی کننده مبتنی بر روشهای هوش جمعی است که در تحقیقات اخیر گزارش شدهاند. در کنار آنها نتایج حاصل از حل مسایل مذکور به وسیله روش پیشنهادی؛ یعنی «طبقهبندی کننده چند هدفة نیروی مرکزی » (MOCFO-classifier) نیز گزارش خواهد شد. طبقهبندی کنندههای ارائه شده در تحقیقات قبل عبارتند از: « طبقهبندی کننده گروه ذرات» (PS-classifier) ]1[، « طبقهبندی کننده هوشمند گروه ذرات با وزن اینرسی»(IPS1-classifier)]2[ و « طبقهبندی کننده هوشمند گروه ذرات با عامل محدود کننده» (IPS2-classifier) ]3[. کلیه شبیه سازیها و آزمایشهای انجام گرفته به وسیله رایانه با واحد پردازش مرکزی Pentium IV 1600 و در محیط نرم افزار MATLAB 7.0 انجام گرفتهاند. جمعیت تصادفی اولیه برای همه طبقهبندی کنندههای فوقالذکر 20 در نظر گرفته شدهاست. سایر ویژگیهای طبقهبندی کنندهها دقیقا همانهایی هستند که در تحقیقات یاد شده گزارش شدهاند. دادههای آموزشی در کلیه شبیه سازیها کاملا به صورت تصادفی و به تعداد مساوی از هر کلاس انتخاب شدهاند. بقیه دادههای موجود به عنوان دادههای آزمایشی تلقی شدهاند.
جداول (1) و (2) به ترتیب نتایج مقایسهای طبقهبندی دادههای گلهای زنبق و دادههای مایعات شیمیایی را برای 30 داده آموزشی (10 نمونه از هر کلاس که به طور تصادفی انتخاب شدهاند) در بر دارد. این جداول شاخصهای «نرخ تشخیص صحیح» و « قابلیت اطمینان» به دست آمده از سه نوع طبقهبندی کننده مبتنی بر روشهای هوش جمعی گزارش شده را در کنار نتایج حاصل از طبقهبندی کننده MOCFO-classifier نشان میدهند. این مقادیر هم برای دادههای آموزشی و هم برای دادههای آزمایشی گزارش شدهاند. تعداد ابر صفحهها در طبقهبندی کننده پیشنهادی 3 و در سایر طبقهبندی کنندهها برای دستیابی به نتایج بهتر به صورت پیش فرض 5 و یا 7 در نظر گرفته شده است. نکته قابل توجه این است که تعداد سه ابر صفحه برای طبقهبندی کننده پیشنهادی به وسیله خود طبقهبندی کننده به دست آمده و در واقع، میتوان گفت این تعداد به همراه سایر نتایج مربوط به این طبقهبندی کننده در واقع مولفههای تشکیل دهنده یکی از نقاط «جبهة پَرِتو» است.
نقاط آموزش و آزمایش کاملا به صورت تصادفی و مشابه با مراجع ]1[ و ]2[ انتخاب شده اند تا مقایسات صورت گرفته معنادار باشند. شایان ذکر است افزایش یا کاهش تعدد الگوهای آموزشی تنها در مکان و معادلات ابرصفحه های محاسبه شده مؤثر است و بر روی نحوه تعریف پروبها و توابع برازندگی بیتاثیر است. نحوه سازماندهی ابر صفحه ها نیز با یک طرح اولیه و تعیین وظیفه تقسیم بندی فضای ویژگی به مناطق مطلوب انجام گرفته است. علت اصلی مقایسه روش پیشنهادی با سه روش طبقه بندی کننده گروه ذرات آن است که توانایی روش بهینه سازی نیروی مرکزی نسبت به روشهای هوش جمعی سنجیده شود؛ ضمن آنکه تعداد ابرصفحههای در نظر گرفته شده برای طبقه بندی کننده های گروه ذرات PS-classifier، IPS1-classifier،وIPS2-classifier صرفا به صورت سعی وخطا و با استفاده از مراجع ]1[، ]2[ و]18[ انجام گرفته است.
مقادیر جداول (1) و (2) معانی در خور توجهی را در بر دارند:
طبقهبندی کننده پیشنهادی (MOCFO-classifier)، عمل طبقهبندی را با تعداد ابر صفحههای کمتری انجام داده است. این در حالی است که متوسط نرخ تشخیص صحیح برای نقاط آزمایشی و متوسط قابلیت اطمینان با این تعداد ابر صفحه از همه موارد مشابه در سایر طبقهبندی کنندهها در این جداول بهتر است. این مسئله شاهدی بر این واقعیت است که ابرصفحههای محاسبه شده به وسیله سایر طبقهبندی کنندهها، ابرصفحههای بهینه نبوده از پاسخهای «غیر چیره شده» به شمار نمیآیند.
در اغلب مقادیر گزارش شده در این جداول تفاوت فاحشی بین نرخ تشخیص نقاط آموزشی و آزمایشی در طبقهبندی کنندههای قبلی وجود دارد (از 5 تا 15 درصد). این مسأله نشأت گرفته از گزینش تعداد ابرصفحههای زیاد برای طبقهبندی دادههای آموزشی است که در واقع همان پدیده «فوق- آموزش» یا «فوق- برازش» است. این در حالی است که تفاوت بین نرخ تشخیص نقاط آموزشی و آزمایشی در طبقه بندی کننده پیشنهادی (MOCFO-classifier) مقدار ناچیزی در حدود 4/2% است. به عبارت بهتر، مشکلات «فوق- آموزش» و «فوق- برازش» در طبقه بندی کننده «چند منظوره گروه ذرات» به چشم نمیخورد و این طبقهبندی کننده میتواند مقدار بهینه تعداد ابرصفحهها را نیز تخمین بزند.
آنچه در این جداول بیش از سایر موارد جلب توجه میکند بهبود قابل توجهی است که در شاخص «قابلیت اطمینان» برای طبقهبندی کننده پیشنهادی، نسبت به سایر طبقه بندی کننده ها رخ دادهاست. علت اصلی این بهبود آن است که در طبقهبندی کنندههای IPS1-classifier و IPS2-classifier، تنها ملاکی که برای تخمین ابرصفحهها در نظر گرفته شده، نرخ تشخیص صحیح دادهها در مرحله آموزش است. به عبارت دیگر، در این طبقهبندی کنندهها تنها یک تابع برازندگی، آن هم برای به حداقل رساندن تعداد نقاط آموزشی که به اشتباه طبقهبندی شدهاند، تعریف شده و هیچ تلاشی برای ساماندهی ابرصفحهها در جهت افزایش شاخص «قابلیت اطمینان» صورت نگرفته است.
در برخی موارد نرخ تشخیص صحیح نقاط آموزشی برای طبقهبندی کنندههای قبلی، نسبت به طبقهبندی کننده پیشنهادی از مقادیر بهتری برخوردار است، اما در تمامی موارد نرخ تشخیص صحیح نقاط آزمایشی برای طبقهبندی کننده معرفی شده از سایر روشها بهتر گزارش شدهاست. این رویداد را نیز میتوان به رخداد مسأله «فوق- آموزش» در طبقه بندی کنندههای دیگر مرتبط دانست.
جدول (1): نتایج مقایسهای به دست آمده برای سه طبقهبندی کننده هوش جمعی در کنار طبقهبندی کننده چند هدفة پیشنهادی (MOCFO-classifier) برای دادههای گلهای زنبق، به ازای 30 نقطه آموزش.
PS-classifier |
IPS2-classifier |
IPS1-classifier |
MOCFO-Classifier |
|
||||
5=H |
5=H |
5=H |
3=H |
|||||
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
|
4/68 |
9/73 |
2/80 |
1/84 |
8/77 |
3/83 |
5/87 |
2/94 |
متوسط قابلیت اطمینان(%) |
5/77 |
4/84 |
3/90 |
7/97 |
9/89 |
7/95 |
0/95 |
5/95 |
متوسط نرخ تشخیص(%) |
جدول (2): نتایج مقایسهای به دست آمده برای سهطبقه بندی کننده هوش جمعی در کنار طبقهبندی کننده چند منظوره پیشنهادی (MOCFO-classifier) برای دادههای مایعات شیمیایی، به ازای 30 نقطه آموزش.
PS-classifier |
IPS2-classifier |
IPS1-classifier |
MOCFO-classifier |
|
||||
7=H |
5=H |
5=H |
3=H |
|||||
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
نقاط آزمایش |
نقاط آموزش |
|
5/63 |
4/75 |
6/76 |
3/81 |
9/72 |
3/78 |
2/84 |
0/90 |
متوسط قابلیت اطمینان(%) |
3/72 |
8/87 |
3/89 |
5/95 |
4/83 |
2/96 |
7/92 |
1/95 |
متوسط نرخ تشخیص(%) |
در مسأله طبقهبندی اهداف رادار، سیگنالهای بازگشتی متعددی از اهداف معرفیشده در ]2[ و]3[ را با افزودن توانهای مختلفی از نویز سفید گوسی شبیه سازی و به عنوان نمونههای آموزشی استفاده کردهایم. نمونههای آزمایشی نیز به روش مشابه و به تعداد لازم شبیه سازی میشوند. جداول (3) و (4) به ترتیب مقادیر متوسط نرخ تشخیص صحیح و قابلیت اطمینان حاصل از اِعمال طبقه بندی کنندههای مختلف را در نسبتهای مختلف سیگنال به نویز، برای نقاط آموزشی نشان میدهند. جداول (5) و (6) همین مقادیر را برای نقاط آزمایشی نشان میدهند. تعداد نقاط آموزشی 100 ( ده نقطه از هر کلاس) و تعداد نقاط آزمایشی نیز برابر با همین مقدار است. تعداد ابرصفحهها برای طبقهبندی کننده پیشنهادی، به وسیله خود این طبقهبندی کننده برابر 5 تخمین زده شدهاست. سایر طبقهبندی کنندهها قادر به تخمین تعداد ابرصفحهها نیستند بنابراین، تعداد ابر صفحهها برای آنها با چندین بار آزمایش و به صورت تجربی به دست آمدهاند. این تعداد برای «طبقهبندی کننده هوشمند گروه ذرات با وزن اینرسی» و «طبقهبندی کننده هوشمند گروه ذرات با عامل محدود کننده» برابر با 8 و برای «طبقهبندی کننده گروه ذرات» برابر با 10 انتخاب شده است.
جدول (3): متوسط نرخ تشخیص صحیح نقاط آموزش(%) در طبقهبندی اهداف رادار برای 100 داده آموزشی در نسبتهای مختلف سیگنال به نویز.
نسبتهای سیگنال به نویز (dB) |
|
|||||
15 |
10 |
5 |
0 |
5- |
10- |
|
8/90 |
1/77 |
9/61 |
0/50 |
7/21 |
4/15 |
MOCFO-classifier |
3/92 |
1/80 |
8/67 |
2/53 |
1/19 |
1/10 |
IPS1-classifier |
4/94 |
9/79 |
1/70 |
5/56 |
1/24 |
4/14 |
IPS2-classifier |
2/73 |
4/61 |
3/56 |
5/37 |
7/16 |
2/12 |
PS-classifier |
جدول (4): متوسط قابلیت اطمینان محاسبه شده در مرحله آموزش(%) در طبقهبندی اهداف رادار برای 100 داده آموزشی در نسبتهای مختلف سیگنال به نویز.
نسبتهای سیگنال به نویز (dB) |
|
|||||
15 |
10 |
5 |
0 |
5- |
10- |
|
9/82 |
1/78 |
1/70 |
1/42 |
0/23 |
7/10 |
MOCFO-classifier |
2/75 |
5/60 |
5/58 |
8/27 |
4/17 |
1/9 |
IPS1-classifier |
3/73 |
5/67 |
7/64 |
3/33 |
4/18 |
2/8 |
IPS2-classifier |
6/66 |
3/50 |
1/42 |
2/21 |
1/13 |
1/10 |
PS-classifier |
جدول (5): متوسط نرخ تشخیص صحیح نقاط آزمایش(%) در طبقه بندی اهداف رادار برای 100 داده آزمایشی در نسبتهای مختلف سیگنال به نویز.
نسبتهای سیگنال به نویز (dB) |
|
|||||
15 |
10 |
5 |
0 |
5- |
10- |
|
6/88 |
8/70 |
9/56 |
8/35 |
1/15 |
3/12 |
MOCFO-classifier |
4/80 |
8/63 |
7/44 |
4/25 |
1/13 |
4/11 |
IPS1-classifier |
3/78 |
5/61 |
6/47 |
4/27 |
3/14 |
1/10 |
IPS2-classifier |
6/74 |
3/57 |
6/41 |
7/20 |
9/13 |
3/8 |
PS-classifier |
جدول (6): متوسط قابلیت اطمینان محاسبه شده در مرحله آزمایش(%) در طبقه بندی اهداف رادار برای 100 داده آزمایشی در نسبتهای مختلف سیگنال به نویز.
نسبتهای سیگنال به نویز (dB) |
|
|||||
15 |
10 |
5 |
0 |
5- |
10- |
|
4/72 |
8/64 |
7/51 |
1/22 |
6/12 |
8/9 |
MOCFO-classifier |
4/62 |
0/51 |
7/41 |
4/15 |
1/9 |
5/7 |
IPS1-classifier |
7/61 |
3/56 |
3/39 |
4/16 |
1/10 |
7/8 |
IPS2-classifier |
4/54 |
9/48 |
6/27 |
3/12 |
1/11 |
3/9 |
PS-classifier |
نتایج مبسوطی که به ترتیب در جداول (3) تا (6) آمده است، صحت ادعاهای منتج از آزمایشهای قبل را در مواجهه با یک مسئله عملی بازشناسی الگو با بردارهای ویژگی 128 عضوی نشان میدهند.
همان طور که از نتایج درج شده در جدول (3) مشاهده میشود، متوسط نرخ تشخیص دادههای آموزشی برای طبقهبندی کننده پیشنهادی (MOCFO-classifier) در برخی موارد کمتر از طبقهبندی کنندههای IPS1-classifier و IPS2-classifier است، ولی باید به یاد داشت که طبقه بندی دادههای آموزشی به تنهایی نمیتواند گویای عملکرد بهتر یک روش نسبت به سایر روشها باشد، زیرا ممکن است در مرحله آموزش با به کارگیری تعداد زیادی از توابع تصمیم (در این جا ابرصفحهها) مقدار خطا کم باشد، اما طبقهبندی کننده دچار مسأله "فوق-آموزش" شده باشد. نتایج مقایسهای به دست آمده از طبقهبندی دادههای آزمایشی صحت این موضوع را اثبات میکند (جدول 5). نتایج مندرج در جدول (5) حاکی از توانایی بیشتر طبقهبندی کننده MOCFO-classifier نسبت به سایر طبقهبندی کنندههای مشابه خود است. این نتایج به خوبی نشان میدهند که ابرصفحههای تخمین زده شده به وسیله طبقهبندی کننده پیشنهادی در مواجهه با دادههای آزمایشی از کارایی بیشتری برخوردارند. نکته مهم دیگر اضافه شدن شاخص «قابلیت اطمینان» به عنوان یک تابع برازندگی دیگر در طبقه بندی کننده پیشنهادی است و همان طور که از جداول 4 و6 قابل استنباط است، در هر دو مرحله آموزش و آزمایش طبقهبندی کننده MOCFO-classifier از «قابلیت اطمینان» بیشتری برخوردار است.
4-2 مقایسه زمان لازم برای همگرایی
طبق مشاهدات و اندازه گیریهای صورت گرفته، متوسط زمان همگرایی برای روش ارائه شده از روش PS-classifier بیشتر و از طبقه بندی کننده های IPS2-classifier و IPS1-classifier بهتر بود. این نتیجه از دو جهت قابل تامل است: نخست اینکه رتبه دوم همگرایی در این روش از آن جهت حایز اهمیت است که در روش پیشنهادی به جای یک تابع برازندگی، در واقع دو تابع برازندگی (یکی نرخ تشخیص صحیح و دیگری قابلیت اطمینان) به طور همزمان ارزیابی و بهینه سازی می شوند. با این حال، روش ارائه شده با نیاز به ابرصفحه های کمتر، توانسته است رتبه دوم همگرایی را کسب کند.
از سوی دیگر، باید توجه داشت که استفاده از این طبقهبندی کتنندها عمدتا به صورت offline است و پس از مرحله آموزش و یافتن ابر صفحه ها، تصمیم در مورد تعلق و یا عدم تعلق یک الگوی ناشناس تنها به قرار گرفتن آن الگو در منطقه خاصی که ابرصفحه ها تعیین می کنند، وابسته است. پس سرعت پردازش در مرحله آزمایش برای هر چهار روش بسیار بالاست.
5- نتیجه گیری و پیشنهادها
در این تحقیق با استفاده از روش «بهینه سازی نیروی مرکزی» الگوریتمی برای بهینه سازی چند هدفه از طریق تعریف تابع تجمیعی بیان شد. سپس، روش بهینه سازی چند هدفة پیشنهادی به عنوان ابزاری کارآمد برای طراحی طبقهبندی کنندههای چند هدفه معرفی و به طبقهبندی کننده چند هدفة MOCFO-classifier منجر گشت. این طبقهبندی کننده، قادر به تخمین توابع تصمیمی است که در محاسبه آنها شاخصهای مختلف و مهم «نرخ تشخیص صحیح»، «قابلیت اطمینان» و «تعداد ابرصفحهها» لحاظ شدهاند. طبقهبندی کننده پیشنهاد شده نه تنها فاقد معایبی نظیر «فوق- آموزش» و «فوق- برازش» است، بلکه میزان اطمینان به تصمیمات اتخاذ شده در آن به میزان قابل توجهی نسبت به سایر موارد مشابه، افزایش یافته است.
همچنین، طبقهبندی کننده چند منظوره طراحی شده قابلیت آن را دارد که به جای یک مجموعه از ابر صفحهها مجموعههایی از پاسخهای متنوع با مقادیر شاخصهای مختلف را در اختیار کاربر قرار دهد. به این ترتیب، امکان برپایی شرایط مورد نظر کاربر در مواردی خاص نیز فراهم میگردد؛ مواردی که در آنها ممکن است «نرخ تشخیص صحیح» مهمتر از «قابلیت اطمینان» باشد (و یا بالعکس).
البته، باید اذعان کرد که در قبال تواناییهای افزوده شده به طبقهبندی کننده پیشنهاد شده «هزینه محاسباتی» آن نیز افزایش یافته است که دلیل عمده آن بهینه سازی چند تابع برازندگی به صورت همزمان است، اما با توجه به اینکه هزینههای محاسباتی در مرحله آموزش لحاظ میشود، میتوان گفت پس از تحمل این محاسبات و تخمین ابرصفحهها در مرحله آزمایش طبقهبندی کننده پیشنهاد شده نسبت به انواع مشابه خود، هیچ گونه بار اضافه محاسباتی را تحمل نمیکند. در واقع، در مرحله آزمایش کافی است معلوم شود الگوی ناشناس به کدام یک از نواحی کد شده به وسیله ابرصفحههای محاسبه شده تعلق دارد.
نکته مهم دیگری که ذکر آن لازم است، پیچیدگی سیستماتیک کمتری است که طبقه بندی کننده پیشنهاد شده نسبت به سایر موارد مشابه (طبقه بندی کننده های هوشمند گروه ذرات) دارد. باید به یاد آورد که طبقهبندی کننده های هوشمند گروه ذرات با وزن اینرسی و با فاکتور محدود کننده هر دو دارای کنترل کننده فازی اضافهای هستند که نقش کنترل پارامترهای مؤثر در روشهای بهینه سازی را در هر بار تکرار حلقه جستجو بر عهده دارند. این کنترل کنندههای فازی اگرچه به جستجوی مؤثر برای یافتن ابرصفحهها کمک می کنند و تعداد تکرار حلقه اصلی را به نحو قابل ملاحظهای کاهش می دهند، اما به پیچیدگی سیستماتیک طبقهبندی کنندههای هوشمندِ گروه ذرات نیز منجر میشوند. طبقه بندی کننده پیشنهاد شده در این تحقیق فاقد هرگونه کنترل کننده اضافی است و از این رو، دارای سادگی بیشتری نسبت به انواع مشابه خود است.
بررسی تئوریک عملکرد طبقهبندی کننده پیشنهاد شده برای دستیابی به ملاکی مقایسهای با «طبقهبندی کننده بیز» (به عنوان یک طبقهبندی کننده بهینه)، به همراه مطالعه پیرامون نحوه تاثیر گذاری پارامترهای الگوریتم بهینه سازی نیروی مرکزی بر عملکرد طبقهبندی کننده چند هدفة پیشنهادی، میتوانند موضوعهای در خور توجهی برای تحقیقات بعدی باشند.
[1] تاریخ ارسال مقاله : 24/2/1391
تاریخ پذیرش مقاله : 19/01/1392
نام نویسنده مسؤول : سعیده شیخ پور
نشانی نویسنده مسؤول : ایران – بیرجند – شوکت آباد- دانشگاه بیرجند- دانشکده مهندسی برق و کامپیوتر- گروه مهندسی الکترونیک
[1]Decision functions
[2]K-nearest neighbor
[3]Fuzzy classifiers
[4]Particle swarm classifier
[5]Score of recognition
[6]Reliability
[7]Hyperplane
[8]Over fitting
[9]Over learning
[10] Multi-objective Central Force Optimization
[11]Conflict
[12]Domination
[13]Pareto-optimality
[14]Evolutionary algorithms
[15]Ant colony optimization
[16] Aggregation function
[17] Conventional Weighted Aggregation
[18] Dynamic Weighted Aggregation
[19] Iris data
[20] Wine data
[21] Automatic target recognition
[22] Ash
[23] Phenol
[24] Flamanoids
[25] Proanthocyanin
[26] Proline
[27] Radar cross section
[28] Polarization