Document Type : Research Article
Authors
1 Department of Computer Engineering, Shahr-e-Qods Branch, Islamic Azad University, Tehran, Iran
2 Department of Computer Engineering, Shahr-e-Qods Branch, Islamic Azad University Tehran, Iran
3 Department of Electrical Engineering, Shahr-e-Qods Branch, Islamic Azad University, Tehran, Iran
Abstract
Keywords
مقدمه
به تکثیر غیرعادی سلولها در بافت سینه، سرطان سینه میگویند. سرطان سینه دومین علت مرگومیر در بانوان، بعد از سرطان ریه و یکی از درمانپذیرترین سرطانها است]1و11[؛ بنابراین، شناسایی زودهنگام تومور سینه، تنها دلیل برای کاهش نرخ مرگومیر سرطان سینه است.
سرطان سینه، یکی از شایعترین سرطانها در میان زنان ایرانی محسوب میشود و سالانه 7 هزار زن ایرانی به این سرطان مبتلا میشوند. این سرطان دومین عامل مرگومیر در بین زنان است که متأسفانه سن شیوع آن در بین زنان جوان کشورمان تأملبرانگیز است. باتوجه به اینکه 70 درصد این بیماران بالای 5 سال عمر میکنند، سن ابتلا به سرطان سینه در ایران 10 -15 سال پایینتر از سن جهانی است. در زمان حاضر بهطور متوسط سن ابتلا به این بیماری در ایران بین 45 تا 55 سال است؛ درحالیکه این سن در کشورهای غربی بین50 تا 60 سال است. با توجه به پایینآمدن میانگین سن ابتلا به این بیماری و اینکه حداکثر جمعیت زنان در ایران جواناند، روند رو به رشد این بیماری را در طول 10 سال آینده خواهیم داشت ]3و2[.
تشخیص سرطان سینه در دانش پزشکی با عدم قطعیت همراه است. ورودیها و خروجیها توأم با عدم قطعیتاند و دادهها نادقیق و کیفیاند. عوامل تأثیرگذار در تشخیص، پیشگیری و درمان سرطان سینه مشخص نیست ]4و3[. با توجه به وجود منابع عدم قطعیت در تشخیص سرطان سینه، در این پژوهش، مدل استنتاج فازی بهمنظور تشخیص و مدیریت عدم قطعیت در دادههای ورودی طراحی شده است. یک سیستم استنتاج فازی از مشکل استاتیکبودن و عدم تطبیق با محیط رنج میبرد. بهمنظور تکامل این سیستمها، پیوند الگوریتمهای تکاملی با سیستم فازی به ایجاد سیستمهای هایبریدی تکامل یافته و جدید منجر میشود. پیوند بین الگوریتمهای تکاملی انجام میشود تا با ترکیب این روشها، قابلیت هر روش به دیگری منتقل شود. در مدلهای هایبریدی میتوان از قابلیتهای روشهای استفادهشده بهطور همزمان بهره برد. الگوریتمهای تکاملی به نحوی از متغیرهای تصادفی در فرایند بهینهسازی استفاده میکنند و مدعی گریز از جوابهای بهینۀ محلی و یافتن جواب بهینۀ سراسری هستند.
از تکنیکهای پردازش تکاملی در فرایند بهینهسازی، آموزش، یادگیری و طراحی سیستمهای پیچیده استفاده میشود. تکنیکهای پردازش تکاملی به دانش فرد خبره نیاز ندارند؛ اگرچه دانش دامنۀ مسئله در بهبود سیستمهای تکاملی مؤثر است. روشهای پردازش تکاملی بهطور موازی روی چندین راهحل کار میکنند، نیاز به مشتقگیری ندارند و میتوانند از روشهای غیرقطعی و احتمالی برای تعیین مکانیزم انتخاب راهحلهای مناسب استفاده کنند و بنابراین، ترکیب این روشها با یکدیگر و سیستم استنتاج فازی که امکان مدیریت منابع عدم قطعیت در آن وجود دارد، به ایجاد سیستمهای بهینه و کارا با عملکرد مناسب منجر خواهد شد ]6و5[.
همچنین، در پژوهش حاضر، مدلکردن روشهای جدید برای چیرهشدن به محدودیتها و مشکلات در تشخیص سرطان سینه انجام شده است. استفاده از ویژگیهای ورودی متفاوت از پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی، اندازۀ مناسب برای تقسیمبندی کافی میان دادههای تست و آموزش و همچنین استفاده از ویژگیهای کمینه برای رسیدن به نرخ طبقهبندی بیشینه برای تشخیص سرطان سینه انجام شده است. استفاده از الگوریتمهای مختلف بهینهسازی کارا و نوین برای تشخیص سرطان سینه با توجه به اندازه نمونۀ داده، زمان پردازش و نرخ طبقهبندی با میزان صحت بالا برای تنظیم پارامترهای سیستم مبتنی بر قانون فازی و مقایسۀ مزایا و معایب روشها روی پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی انجام شده است تا تشخیص زودهنگام سرطان سینه فراهم شود و مرگومیر ناشی از این بیماری کاهش یابد.
سیستمهای همیار کامپیوتر به کمک تشخیص پزشکی ، مجموعهای از ابزارهای خودکار و نیمهخودکارند که میزان صحت و تشخیص و اعتماد رادیولوژیستها را به تفسیر تصویر در تشخیص سرطان سینه بهبود میدهند و بهعنوان ابزاری برای تشخیص تودههای سرطان سینه برای کمک به رادیولوژیستها به شمار میآیند ]12[.
مروری بر کارهای مرتبط با سرطان سینه
در مقالات بررسیشده، از پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی (MIAS) ، برای تشخیص سرطان سینه استفاده شده است.
در روش ارائهشده از سولامی و همکاران ]13[، ابتدا ناحیۀ مدنظر سینه با الگوریتم بهینهسازی ازدحام ذرات استخراج شده است، سپس ویژگیهای شکل و بافت سینه تودهها بهترتیب با استفاده از تبدیل فوریه و ماتریس همرخداد سطح خاکستری استخراج شدهاند. طبقهبندی تودههای شناساییشده با ماشین بردار پشتیبان انجام شده است که ناحیۀ قطعهبندیشده را بر پایۀ ویژگیهای استخراجشده از روشهای ذکرشده به نرمال و غیرنرمال طبقهبندی میکند. میزان صحت طبقهبندی 87/83% به دست آمده است.
در پژوهش ارائهشده از پاوار و تالبار ]14[، روش انتخاب ویژگی موجک همرخداد با استفاده از سیستم فازی ژنتیک در مسئلۀ طبقهبندی تصاویر ماموگرافی مطرح شده است. ویژگیهای استخراجشده از مرحلۀ استخراج ویژگی شامل انرژی، برآمدگی خوشه، سایه خوشه، مجموع واریانس، مجموع میانگین و آنتروپی از ماتریس همرخداد سطح خاکستری (GLCM) محاسبه شدهاند و درواقع ویژگیهای موجک همرخدادند. ویژگیهای موجک همرخداد از جزئیات ضریبهای موجک در هر سطح از تجزیه از تصاویر به دست آمده است. در چهار سطح از تجزیه ویژگیها انتخابشده و بهترین نرخ میانگین طبقهبندی در سطح چهار از تجزیه با انتخاب 16 ویژگی از 72 ویژگی 47/89% به دست آمده است.
سیستم ارائهشده از سریکریشنا و همکاران ]15[، از یک شناسایی دقیق با استفاده از تکامل تفاضلی مبتنی بر الگوریتم خوشهبندی فازی برای تشخیص ضایعهها در تصاویر ماموگرافی استفاده میکند. موقعیت ضایعه که رادیولوژیست بهصورت دستی نشانهگذاری کرده، با موقعیت ضایعه که سیستم بهصورت اتوماتیک به دست آورده، مقایسه شده است. قطعهبندی با الگوریتم تکامل تفاضلی مبتنی بر خوشهبندی فازی به نشانهگذاری واقعی رادیولوژیست نزدیک است و میتواند برای تشخیص پزشکی پیشنهاد شود.
پژوهش انجامشده از ژانگ و همکاران ]16[ یک روش جدید مبتنی بر انرژی آنتروپی موجک و طبقهبندی رگرسیون خطی را توسعه داده است. ابتدا ناحیۀ مدنظر از تصاویر ماموگرافی جدا شده است. در مرحلۀ دوم، آنتروپی انرژی موجک برای تصاویر قطعهبندیشده محاسبه شده و در مرحلۀ آخر، طبقهبند رگرسیون خطی برای طبقهبندی موارد نرمال و غیرنرمال استفاده شده است. میزان صحت در این روش، 85/91% به دست آمده است.
برای طبقهبندی تصویرها به موارد نرمال و نامتقارن، مگنا و همکاران ]17[ عملکرد طبقهبند سیستم ایمنی مصنوعی سازگار در این مقاله را بررسی کردهاند. برای آزمایش کارایی الگوریتم، پایگاه داده انجمن تجزیهوتحلیل تصاویر ماموگرافی در نظر گرفته شده است. نتایج نشان میدهند سیستم ایمنی مصنوعی سازگار به بهترین نتایج در مقایسه با طبقهبندهای متداولتر میرسد. نرخ طبقهبندی در این سیستم 85% است.
در این پژوهش، تشخیص سرطان سینۀ لی و همکاران ]18[ بر پایۀ یادگیری ماشین بیشینه انجام شده است. این مقاله یک عملکرد خوب از دیدگاه میزان حساسیت به تشخیصهای درست و نادرست و میزان صحت دارد و همچنین کاهش درخور توجه در زمان آموزش در مقایسه با روشهای دیگر از مزایای این روش است. مدل قطعهبندی پیشنهادشده، بهکارگیری بردارهای ویژگی انتخاب شده و طبقهبندی مؤثر یادگیری ماشین بیشینه، یک سیستم رضایتبخش را فراهم میکند.
ستایلیانوس و همکاران، یک روش طبقهبندی و قطعهبندی تمام اتوماتیک را برای تصاویر ماموگرافی بر پایۀ تخمین تراکم سینه و شناسایی عدم تقارن معرفی کردهاند ]19[. ابتدا پیشپردازش تصویر و تکنیکهای قطعهبندی، شامل الگوریتم استخراج مرز سینه و یک نوع بهبودیافته از روش قطعهبندی ماهیچه قرارگرفته روی سینه، به کار برده شده است. ویژگیها برای طبقهبندی تراکم سینه استخراجشده، شامل یک ویژگی جدید وابسته به بعد پرشکن و ماشین بردارهای پشتیبان که برای طبقهبندی به کار برده شدهاند، به میزان صحت بالای 7/85% رسیدهاند. بیشتر این خصوصیات برای استخراج یک مجموعه از ویژگیهای آماری برای هر سینه استفاده شده است. تفاوت میان ارزش این ویژگیها برای شناسایی عدم تقارن بین دو تصویر از هر جفت تصویر ماموگرافی استفاده شده است. با استفاده از طبقهبند یک کلاسه ماشین بردار پشتیبان، که نرخ موفقیت 47/84% را نتیجه میدهد، نتایج، نرخ موفقیت را برابر یا بالاتر از کارهای مرتبط دیگر نشان میدهد.
در مقاله ارائهشده از سیواکومار و کارنان ]20[، بهینهسازی کلنی زنبور عسل برای شناسایی خودکار مرز سینه و موقعیت نوک سینه برای شناسایی ناحیۀ مشکوک روی عکسهای سینه دیجیتال بر پایۀ کاهش دو طرفه بین تصویر سینه چپ و راست است. این الگوریتم روی عکسهای سینۀ گرفتهشده از پایگاه داده انجمن تجزیهوتحلیل تصاویر ماموگرافی تست شده است. نرخ شناسایی 40/96% است.
تبرید شبیهسازیشده، جستجوی ممنوعه، الگوریتم ژنتیک و سیستم کلونی مورچه، چهار الگوریتم اصلی برای حل مشکلات چالشبرانگیز در سیستمهای هوشمند است. در مقاله ارائهشده لوچانامبال و کارنان ]21[، این چهار تکنیک و سه ترکیب هایبریدی نوین از آنها برای قطعهبندی تصاویر سینه پیشنهاد شده است. الگوریتمهای هایبریدی نوین بهترتیب شامل سیستم کلونی مورچه - جستجوی ممنوعه و جستجوی ممنوعه - سیستم کلونی مورچه است. جستجوی ممنوعه - سیستم کلونی مورچه بهترین راهحل را فراهم میکند. میزان صحت روش قطعهبندی 96% ارزیابی شده است.
در پژوهش انجامشده از راستی بروجنی و همکاران ]8[ یک سیستم CAD براساس شبکههای عصبی کانولوشن سلسله مراتبی با ساختاری جدید، برای ایجاد تمایز بین تومورهای خوشخیم و بدخیم در تصاویر MR سینه پیشنهاد شده است. برای ارزیابی عملکرد این روش، از یک رویکرد متداول استخراج ویژگی و طبقهبندی براساس شبکۀ عصبی MLP بهعنوان یک معیارسنج استفاده شده است.
در روش ارائهشده از علیاکبری دهکردی و همکاران ]9[ یـک روش ترکیبـی هوشـمند مبتنـی بر سیستم فازی - عصبی برای کاهش نویز نمک و فلفل از تصاویر پزشکی ارائه میشود. نتایج اجرای این روش روی تصاویر پزشکی که چگالی نویز بالایی دارند، توانایی این روش در حذف نویز و حفظ جزئیات نسبت به روشهای دیگر را نشان میدهد.
در تحقیق انجامشدۀ جروقی و همکاران ]10[، روش جدیدی بر پایۀ مدل ترکیبی بهینهسازی ازدحام ذرات باینری و آنالیز تفکیککنندۀ خطی بیز برای طبقهبندی دادههای با ابعاد بالا ارائه شده است.
بر پایۀ تحلیل نتایج، آشکار است که یکی از محدودیتهای مشترک در مطالعات بررسیشده، مقدار نمونههای دادۀ کم است. زمانی که از طبقهبندی برای تشخیص سرطان سینه استفاده میشود، لازم است سایز مجموعه دادههای آموزش، به اندازۀ کافی بزرگ باشد. فعالیتهای چشمگیر برای گردآوری انواع مختلف داده در زمینۀ سرطان سینه نیاز است. لازم است برای تحقیقات بیشتر، پایگاه دادههای عمومی بیشتر ایجاد شود تا مجموعه دادۀ معتبر از بیماران مبتلا به سرطان سینه را جمعآوری کند و بتوان با استفاده از انواع پارامترهای ورودی جمعآوریشده، سیستمها و روشهای مختلف را اعتبارسنجی کرد.
علاوه بر سایز داده، کیفیت مجموعۀ داده، کاربرد تکنیکهای متفاوت و کارآمد برای مرحلۀ استخراج ویژگی، انتخاب ویژگیهای دقیق و طبقهبندی در رسیدن به جواب بهینهتر در سیستمهای درحال رشد همیار کامپیوتر به کمک تشخیص پزشکی، مهم است. استفاده از تکنیکهای متفاوت پیشپردازش تصویر روی مجموعه داده برای بهبود کیفیت نیاز است. برای تشخیص دقیق سرطان سینه انتخاب زیر مجموعۀ آموزندهترین ویژگیها برای آموزش یک مدل بهواسطۀ انتخاب ویژگی، میتواند مدلهای قویتری نتیجه دهد؛ بنابراین، چندین نکته برای رسیدن به عملکرد بالا وجود دارد که یکی از آنها تعداد ویژگی کمینه با نرخ میزان صحت طبقهبندی بیشینه است.
یکی دیگر از چالشهای اساسی در پژوهشها انتخاب الگوریتم مناسب برای حل مسئله است که به پارامترهای زیادی بستگی دارد. انواع دادۀ جمعآوریشده، سایز نمونۀ داده، محدودیتهای زمان و همچنین ماهیت سیستم در تعیین الگوریتم برای حل مسئله مؤثر است. همچنین مسئلۀ دیگر، استفاده از تست اعتبارسنجی مناسب برای تخمین عملکرد الگوریتمها است. برای این منظور در پژوهش حاضر، روش ارزیابی شناختهشده و پرکاربرد اعتبارسنجی چندبخشی (k fold cross validation) که دادهها را به مجموعههای تست و آموزش تقسیم میکند، برای به دست آوردن نتایج دقیق و اطمینانبخش پیشنهاد شده است.
تکنیکهای محاسبات نرم مبتنی بر فازی پیشنهادی
در این بخش، تکنیکهای محاسبات نرم مبتنی بر فازی پیشنهادی شامل الگوریتمهای هایبریدی فازی - تکاملی پیشنهادی برای بهینهسازی پارامترها و بهکارگیری آنها برای تشخیص سرطان سینه بیان شدهاند.
در پژوهش حاضر، ابتدا دادهها پیشپردازش شدهاند. توابع عضویت و قوانین سیستم استنتاج فازی با دانش فرد خبره طراحی شدهاند. سپس پارامترهای توابع عضویت سیستم استنتاج فازی با الگوریتمهای هایبریدی تکاملی تنظیم شدهاند.
شکل مربوط به روند تکنیکهای محاسبات نرم مبتنی بر فازی استفادهشده در پژوهش با استفاده از الگوریتمهای هایبریدی تکاملی مبتنی بر فازی، در شکل 1 معرفی شده است.
3 -1. پایگاه دادهها
برای ارزیابی مدلهای پیشنهادی از اطلاعات 322 نمونه تصویر ماموگرافی واقعی بیماران استفاده شده که از پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی گرفته شده و بهصورت آنلاین برای اهداف علمی دردسترس است ]22[. هر تصویر شامل اطلاعات ویژگیهای بافت زمینه، طبقۀ غیرعادی بودن توده، شعاع از مرکز توده، مختصات X و Y از مرکز توده و شدت غیرعادی بودن توده است که رادیولوژیست تعیین کرده است. از این 322 نمونه، 62 نمونه خوشخیم، 51 نمونه بدخیم و 209 نمونه نرمال است. با توجه به فراوانی دادههای هر کلاس، میانگین وزن دار آن در نظر گرفته و در تابع فیتنس اعمال شده است.
در پژوهش حاضر، در هر تصویر موقعیت توده با استفاده از مختصات X و Y از مرکز توده و شعاع توده که رادیولوژیست تعیین کرده، بهصورت دستی در یکی از نواحی چهارگانۀ سینه تخمین زده شده است. هر سینه شامل چهار ناحیه است که با چهار عبارت زبانی فوقانی داخلی ، تحتانی داخلی ، فوقانی خارجی و تحتانی خارجی تعریف میشود. همچنین اندازۀ توده با استفاده از شعاع از مرکز توده تعیین شده است.
3 -2. سیستم استنتاج فازی پیشنهادی
توابع عضویت و قوانین سیستم استنتاج فازی برای تشخیص سرطان سینه با دانش فرد خبره طراحی شده است. مراحل مورد نیاز برای طراحی یک سیستم استنتاج فازی عبارتاند از: 1. جمعآوری اطلاعات، که دانشی درخصوص صورت مسئله، دادهها و متغیرهای ورودی و خروجی از فرد خبره کسب میشود. 2. متغیرهای ورودی و خروجی و تعداد عبارتهای زبانی مربوط به هر متغیر شناسایی میشود. 3. مدل استنتاج فازی از نوع سوگنو یا ممدانی مشخص میشود. 4. قوانین با استفاده از دانش فرد خبره استخراج میشود. 5. توابع عضویت و پارامترهای آن طراحی میشود. 6. سیستم طراحیشده با دادههای واقعی ارزیابی میشود.
سیستم استنتاج فازی پیشنهادی شامل 4 متغیر ورودی و 1 متغیر خروجی است. متغیرهای ورودی سیستم استنتاج فازی شامل ویژگیهای بافت زمینه، نوع توده (طبقۀ غیرعادی بودن توده)، اندازۀ توده، موقعیت توده و متغیر خروجی، شدت غیرعادی بودن تعریف شده است. متغیرهای ورودی و خروجی و عبارتهای زبانی مربوط به هر متغیر در جدول 1 آورده شدهاند. توابع عضویت سیستم استنتاج فازی متناظر با تمام مجموعههای فازی، به دلیل پراکندگی دادههای پزشکی حول یک نقطه، گوسین تعریف شده است. تعدادی از قوانین اگر - آنگاه فازی که دانش فرد خبره استخراج کرده، در جدول 2 بیان شده است.
جدول (1): متغیرهای ورودی و خروجی سیستم استنتاج فازی ]22[
متغیرهای ورودی و خروجی عبارتهای زبانی مربوط به هر متغیر
ویژگیهای بافت زمینه 1- چربیسان 2- غدههای چربی سان 3- غدههای متراکم
نوع توده 1- انباشت کلسیم 2- واضح 3- سوزنی شکل 4- نامعلوم 5- کج و کولگی 6-عدم تقارن 7- نرمال
اندازۀ توده 1- کوچک 2- متوسط 3- بزرگ
موقعیت توده 1- فوقانی داخلی 2- تحتانی داخلی 3- فوقانی خارجی 4- تحتانی خارجی
شدت غیرعادی بودن 1- بدخیم 2- خوشخیم 3- نرمال
جدول (2): تعدادی از قوانین اگر - آنگاه سیستم استنتاج فازی
1 اگر موقعیت توده فوقانی خارجی باشد، شدت غیرعادی بودن بدخیم است.
2 اگر نوع توده واضح و اندازۀ توده کوچک باشد، شدت غیرعادی بودن خوشخیم است.
3 اگر نوع توده نامعلوم و اندازۀ توده متوسط باشد، شدت غیرعادی بودن بدخیم است.
4 اگر نوع توده سوزنی شکل و اندازۀ توده کوچک باشد، شدت غیرعادی بودن بدخیم است.
3 -3. الگوریتمهای هایبریدی فازی - تکاملی پیشنهادی برای بهینهسازی پارامترها
الگوریتمهای هایبریدی مبتنی بر فازی پیشنهادی شامل الگوریتم فازی - مبتنی بر آموزش و یادگیری، فازی - بهینهسازی ازدحام ذرات و فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات است که برای فرایند بهینهسازی پارامترهای سیستم استنتاج فازی با قوانین و دانش فرد خبره استفاده شدهاند. مراحل اجرای سیستمهای هایبریدی مبتنی بر فازی معرفیشده به این صورت است:
1 - سیستم استنتاج فازی با دانش فرد خبره طراحی شده است.
2 - پارامترهای لازم برای نمایش توابع عضویت مجموعههای فازی ورودی و خروجی تعیین شده است.
3 – راهحل اولیه با مرتبکردن پارامترهای توابع عضویت هر متغیر ورودی و خروجی با لحاظکردن محدودیتهای لازم برای تولید جوابهای معتبر تولید شده است.
4 - بردار اولیه ارزیابی شده است.
5 - بردار اولیه بهترین راهحل بهدستآمده در نظر گرفته شده است.
6 - پارامترهای الگوریتم هایبریدی تکاملی پیشنهادی برای بهینهسازی تنظیم شده است.
7 -الگوریتم هایبریدی فازی - تکاملی پیشنهادی اجرا شده است.
3 -3 -1. الگوریتم هایبریدی فازی - مبتنی بر آموزش و یادگیری پیشنهادی
الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری (TLBO)از جدیدترین الگوریتمهای ابتکاری است که بدون نیاز به تعیین پارامتر کنترلی خاص، عملیات بهینهسازی را طی دو مرحلۀ معلم و آموزش انجام میدهد. این الگوریتم که الهامگرفته از فرایند طبیعی آموزش و یادگیری است، نخستین بار رائو ، ساوسانی و واخاریا در سال 2011 ابداع کردند ]25 -23[. این الگویتم در سال 2013 بهبود یافته است ]26[.
برای اجرای الگوریتم فازی - بهینهسازی مبتنی بر آموزش و یادگیری پیشنهادی مراحل زیر بهترتیب انجام میشود:
1- سیستم استنتاج فازی سوگنو پیشنهادی طراحی میشود و پارامترهای آن تعیین میشود.
2- جمعیتی از دانشآموزان با پارامترهای توابع عضویت سیستم فازی مقداردهی میشود.
3- میانگین اعضای جمعیت محاسبه میشود و n عضو برتر از جمعیت بهعنوان معلم انتخاب میشود.
4- مرحله معلم طبق فرمول 1 اجرا میشود ]23و24[.
(1) X_new=X_old + r (X_teacher-(T_F )Mean )
که در آن T_F عامل آموزشی است که باعث میشود مقدار میانگین تغییر کند و از رابطۀ زیر به دست میآید. عامل آموزش بهطور خودکار در جستجو تغییر میکند. r عدد تصادفی در بازه ]0و1[ است.
در رابطه 2، X_(total-k) نتیجه هر دانشآموز، k، با توجه به تمام افراد در تکرار i و X_(total-kbest) نتیجۀ معلم در همان تکرار است ]23و24[.
(2) 〖(T_F)〗_i=〖(X_(total-k)/X_(total-kbest) )〗_i
5 - ارزیابی و جایگزینی با نسل قبل صورت میگیرد.
6- مرحلۀ دانشآموز انجام میشود ]23و24[.
(3) x_new = x_old+r( x_i - x_j )
بهصورت تصادفی دو دانشآموز x_i و x_j انتخاب میشود (i≠j) و دانشآموز جدید از رابطۀ 3 به دست میآید.
7- ارزیابی و جایگزینی با نسل قبل انجام میشود.
8- شرط توقف بررسی میشود. الگوریتم از مرحلۀ 3 تکرار میشود تا زمانی که به شرط توقف برسد.
9- مقدار بهینۀ پارامترها تعیین میشود.
فلوچارت اجرای الگوریتم فازی - مبتنی بر آموزش و یادگیری پیشنهادی در شکل 2 مشاهده میشود.
3 -3 -2. الگوریتم هایبریدی فازی - ازدحام ذرات پیشنهادی
بهینهسازی ازدحام ذرات (PSO) یکی دیگر از روشهای بهینهسازی الهامگرفته از طبیعت است. نخستین بار دو نفر به نامهای کندی و ابرهارت این روش را در سال 1995 ابداع کردند ]30 -27[. در این الگوریتم که با الهامگیری از زندگی گروهی جانوران، بهویژه پرندگان و ماهیها ابداع شده است، برای حل یک مسئلۀ بهینهسازی، جمعیتی از جوابهای کاندید با استفاده از یک فرمول ساده بهطور تصادفی در دامنۀ مسئله به حرکت درآورده میشوند و با هدف یافتن جوابهای بهینۀ سراسری کاویده میشوند. در الگوریتم بهینهسازی ازدحام ذرات هر یک از این جوابهای کاندید را اصطلاحاً یک ذره مینامند و هر ذره برای مثال، متناظر با یکی از پرندگان موجود در یک دسته پرندۀ در حال پرواز است ]7[.
مراحل اجرای الگوریتم فازی - ازدحام ذرات پیشنهادی در زیر آورده شده است:
1- سیستم استنتاج فازی پیشنهادی طراحی میشود و پارامترهای آن تعیین میشود.
2- جمعیتی از ذرات با موقعیت و سرعت اولیه با استفاده از پارامترهای توابع عضویت سیستم فازی مقداردهی میشود. در آغاز اجرای الگوریتم، سرعت تمامی ذرات برابر با صفر در نظر گرفته میشود.
3- شایستگی هر یک از ذرات ارزیابی میشود و P_b (بردار موقعیت بهینهترین نقطۀ یافتشده از هر ذره) و G_b (بردار موقعیت بهینهترین نقطۀ یافتشده از تمامی ذرات) انتخاب میشود.
4- پارامترهای الگوریتم ازدحام ذرات تنظیم میشود.
5- سرعت ذرۀ j ام در تکرار i ام با استفاده از معادلههای 4 و 5 محاسبه بهروزرسانی میشود ]30 -27[.
(4) V_j (i)=K*(V_j (i-1)+c_1 r_1 [P_(best,j)-X_j (i-1)]+c_2 r_2 [G_best-X_j (i-1)])
(5) K=2/|2-∅-√(∅^2-4∅)|
که در آن، j=1,2,…,N ، c_1 و c_2 بهترتیب ضرایب یادگیری شناختی (یا فردی ) و اجتماعی (یا گروهی )، و r_1 و r_2 دو عدد تصادفی با توزیع یکنواخت در بازۀ 0 تا 1 هستند. K تابعی از c_1 و c_2 است که در آن ∅>4 و ∅=∅1+∅2 است. C1 و C2 نیز از معادلۀ 6 به دست میآید ]27[.
(6) C1=K*∅1 , C2=K*∅2
6 - موقعیت ذرۀ j ام در تکرار iام با استفاده از معادلۀ 7 محاسبه بهروزرسانی میشود ]30 -27[.
(7) X_j (i)=X_j (i-1)+V_j (i); j=1,2,…,N
7 - شایستگی هر ذره ارزیابی میشود و P_b و G_b بهروزرسانی میشود.
8 - شرط توقف بررسی میشود. الگوریتم از مرحلۀ 5 تکرار میشود تا زمانی که به شرط توقف برسد.
9 - مقدار بهینۀ پارامترها تعیین میشود.
فلوچارت اجرای الگوریتم فازی - ازدحام ذرات پیشنهادی در شکل 3 مشاهده میشود.
3 -3 -3. الگوریتم هایبریدی فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی
در الگوریتم هایبریدی فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی، سیستم استنتاج فازی، الگوریتم بهینهسازی ازدحام ذرات و الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری ادغام شدهاند. ادغام الگوریتمها به این صورت است که در مرحلۀ معلم، از بهترین تجربۀ شخصی ذرات، معلم انتخاب میشود و همچنین برای ایجاد جمعیت جدید نیز، از بهترین تجربۀ شخصی هر ذره استفاده میشود. به عبارتی میانگین کلاس به سمت بهترین تجربۀ شخصی هر عضو حرکت میکند و در آخر بهترین تجربههای شخصی و سراسری بهروزرسانی میشوند. در مرحلۀ دانشآموز نیز، برای تولید جمعیت جدید، از بهترین تجربه شخصی ذرات استفاده میشود و بهترین تجربههای شخصی و سراسری بهروزرسانی میشوند. سپس برای به دست آوردن بهترین تجربههای شخصی و سراسری در مرحلۀ بعد، الگوریتم بهینهسازی ازدحام ذرات بهعنوان زیر تابع الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری اجرا میشود و این سیکل با توجه به تعداد نسلها ادامه مییابد. مراحل اجرایی الگوریتم فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی در زیر آورده شده است:
1 - سیستم استنتاج فازی سوگنو و ممدانی پیشنهادی، طراحی و پارامترهای آن تعیین میشود.
2 - مقداردهی اولیه به جمعیتی از ذرات (دانشآموزان) با سرعت و موقعیت و ارزیابی فیتنس اولیۀ هر یک از ذرات و انتخاب بردار موقعیت بهترین نقطۀ یافتشده توسط ذره و بردار موقعیت بهترین نقطۀ یافتشده توسط تمامی ذرات.
3 - بهازای هر نسل مراحل زیر انجام میشود:
3 -1 - محاسبۀ میانگین اعضای جمعیت
3 -2 - انتخابn عضو برتر از جمعیت بهعنوان معلم از بین بهترین تجربۀ شخصی ذرات
3 -3 - تغییر راهحل (دانشآموز یا ذره) مبتنی بر بهترین راهحل که از فرمول 8 به دست میآید ]23و24[.
(8) X_new=X_old + r (X_teacher-(T_F )Mean )
3-4 - ارزیابی شایستگی هر یک از ذرات و انتخاب بردار موقعیت بهینهترین نقطۀ یافتشده توسط ذره و بردار موقعیت بهینهترین نقطۀ یافتشده توسط تمامی ذرات که در صورت بهتربودن جایگزین شوند.
3 -5 - انتخاب دو راهحل x_j و x_i بهصورت تصادفی و تغییر راهحل با استفاده از رابطۀ 9 انجام میشود ]23و24[.
(9) x_new = x_old+r( x_i - x_j )
3-6- ارزیابی شایستگی هر یک از ذرات و انتخاب بردار موقعیت بهینهترین نقطۀ یافتشده توسط ذره و بردار موقعیت بهینهترین نقطۀ یافتشده توسط تمامی ذرات که در صورت بهتربودن جایگزین شوند.
3-7- بهازای تعداد تکرار مشخص مراحل زیر انجام میشود.
3 -8 – بهروزرسانی سرعت و موقعیت هر ذره که با روابط 10 و 11 به دست میآید ]30 -27[.
(10) X_j (i)=X_j (i-1)+V_j (i); j=1,2,…,N
(11) V_j (i)=K*(V_j (i-1)+c_1 r_1 [P_(best,j)-X_j (i-1)]+c_2 r_2 [G_best-X_j (i-1)])
3 -9 - ارزیابی شایستگی هر یک از ذرات و انتخاب بردار موقعیت بهینهترین نقطۀ یافتشده توسط ذره و بردار موقعیت بهینهترین نقطۀ یافتشده توسط تمامی ذرات که در صورت بهتربودن جایگزین میشوند.
4 -در صورت برآوردهنشدن شرایط خاتمه به مرحلۀ (3 -1) میرود.
5- مقدار بهینۀ پارامترها تعیین میشود.
فلوچارت اجرای الگوریتم فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی در شکل 4 مشاهده میشود.
تحلیل نتایج آزمایشی
در این بخش، مقایسه و تحلیل نتایج بهدستآمده از تکنیکهای هوش محاسباتی پیشنهادی در این پژوهش بهصورت دستهبندی ارائه میشود. نتایج هر روش پیشنهادی با معیارهای ارزیابی یکسان مقایسه شدهاند. همچنین نتایج با یافتههای دیگر محققان، مقایسه و دلایل تفاوت و مزایای سیستمهای پیشنهادی ذکر میشود.
4 -1.پیشپردازش دادهها
عملیات پیشپردازش داده شامل حذف نویز و نرمالسازی دادهها است. ابتدا دادهها نرمالایز شده است، سپس با استفاده از روش خوشهبندی مبتنی بر شناسایی اوتلایر (داده پرت) عملیات حذف دادههای خارج از محدوده انجام شده است. مراحل روش خوشهبندی مبتنی بر شناسایی داده پرت برای حذف تعدادی از دادههای نویزی بهصورت زیر است ]31[:
1 - تعداد خوشهها برابر با تعداد کلاسهای خروجی در نظر گرفته میشوند. هر خوشه شامل کلیۀ متغیرهای ورودی مربوط به هر کلاس خروجی است؛ بنابراین، سه خوشۀ بدخیم، خوشخیم و نرمال وجود دارد.
2 - برای هر کدام از متغیرهای ورودی در هر خوشه میانگین حساب میشود.
3 - برای هر کدام از متغیرهای ورودی در هر خوشه با استفاده از فرمول 12 کواریانس به دست میآید.
(12) S_i= 1/(n_i-1) ∑_(X∈m_i)▒〖( X_i-m_i ) 〖( X_i-m_i )〗^T 〗
که در آن X_i خوشه i ام، m_i میانگین بهازای متغیرهای ورودی مربوط به هر خوشه و n_iاندازۀ خوشه i ام است.
4 - شعاع نرمالشدۀ آماری دادهها، T مربع ، با استفاده از فرمول 13 به دست میآید.
(13) T_i^2= ( X_i-m_i ) S_i^(-1) ( X_i-m_i )^T
که در آن X_iخوشه i ام، m_i میانگین بهازای متغیرهای ورودی مربوط به هر خوشه وS_i^(-1) معکوس کواریانس بهدستآمده برای متغیرهای ورودی در هر خوشه با فرمول مرحلۀ قبل است.
5- مقدار α با توجه به ابعاد مسئله و به نحوی تعیین میشود که ماهیت مسئله از دست نرود. هرچه α بیشتر باشد، تعداد دادههای حذفی بیشتر خواهد بود. α با سعی و خطا برابر با 5 در نظر گرفته شده است.
6- مقادیر بهدستآمده برای شعاع با فرمول T مربع بهازای هر داده با مقدار α مقایسه میشود و دادههایی که مقدارشان بیشتر از α باشد، بهعنوان دادۀ پرت شناسایی میشوند و حذف خواهند شد. باتوجه به مقدار تعیینشده برای α ، 27 مورد داده حذف شدهاند.
اطلاعات 322 داده واقعی بیماران که از پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی گرفته شده، ابتدا نرمالایز شده و سپس با استفاده از روش مبتنی بر شناسایی داده پرت که در بالا توضیح شده، 27 مورد داده حذف شدهاند. پس از مرحلۀ پیشپردازش داده، از 295 دادۀ باقیمانده برای ارزیابی کارایی روشها استفاده شده است. در شکل 5 نمونهای از تصاویر ورودی از پایگاه داده و اطلاعات آن آورده شده است.
4 -2. معیارهای ارزیابی
برای سنجش کارایی سیستمهای پیشنهادی در این پژوهش و مقایسه با مدلهای دیگر از تحلیل منحنی مشخصۀ عملکرد سیستم استفاده شده است. منحنی مشخصۀ عملکرد سیستم معیاری مناسب است؛ چون موازنهای بین تشخیصهای درست و نادرست سیستم یا به عبارتی سود و هزینۀ سیستم را بهطور همزمان به تصویر میکشد.
یک سیستم طبقهبندی، برچسب طبقۀ یک نمونه را پیشبینی میکند. هر نمونه یک برچسب واقعی و یک برچسب پیشبینی دارد. در بحث تحلیل منحنی مشخصۀ عملکرد سیستم یک آستانۀ تصمیم تعیین میشود؛ مقادیر کمتر از آن، منفی و مقادیر بزرگتر از آستانه، مثبت در نظر گرفته میشوند. در آنالیز منحنی مشخصۀ عملکرد، معیارهای زیر محاسبه میشوند: آنهایی که مثبت بودند و درست مثبت تشخیص داده شدهاند (TP)، مثبت بودند و منفی تشخیص داده شدهاند (FN)، منفی بودند و درست منفی تشخیص داده شدهاند (TN) و آنهایی که منفی بودند و مثبت تشخیص داده شدهاند (FP). ماتریس کانفیوژن براساس برچسب واقعی و برچسب پیشبینیشدۀ نمونهها و معیارهای TP، FN، TN و FP تشکیل میشود.
فرمول 14 ویژگی ]35 -32[:
(14) tn rate=Specificity= TN/(FP+TN)
فرمول 15 میزان صحت:
(15) Accuracy= (TP+TN)/(TP+FP+TN+FN)
چنانچه تعداد طبقات یا دستهها برابر n باشند، ماتریس کانفیوژن، ماتریس n n حاوی n طبقهبندی درست و n^2–n خطای احتمالی است. یک راهکار برای پرداختن به مسئلهای n طبقهای، ساخت n منحنی مشخصۀ عملکرد سیستم مختلف برای هر کدام از طبقات یا دستهها است. این را فرمول مرجع طبقه مینامند. به عبارت مشخص، اگر C مجموعۀ تمام طبقات باشد، منحنی مشخصۀ عملکرد سیستم i، عملکرد طبقهبندی را با استفاده از طبقۀ c_i طبقۀ مثبت نشان میدهد و تمام طبقات دیگر را طبقۀ منفی مشخص میکند. براساس تعاریف بالا، در این پژوهش، کلاس خوشخیم و بدخیم، کلاس مثبت و کلاس نرمال، کلاس منفی در نظر گرفته شده است.
یکی دیگر از معیارهای قابل اطمینان برای گزارش دقت عملکرد سیستم، مساحت زیر منحنی مشخصۀ عملکرد سیستم است. این روش با پدیدآوردن منحنی مشخصۀ عملکرد سیستم مرجع برای هر طبقه و درپی آن اندازهگیری مساحت زیر منحنی، مساحت زیر منحنیهای مسائل چندطبقه را به دست میآورد؛ سپس مساحت زیر منحنیهای وزندهیشده بر حسب شیوع طبقۀ مرجع در دادهها را باهم جمع میبندد. به عبارت دقیقتر، تعریف این روش از مساحت زیر منحنی مجموع بدین صورت است:
(16) 〖AUC〗_total= ∑_(c_i ϵC)▒〖AUC(c_i )∙p(c_i)〗
که در رابطه 16، AUC(c_i )، مساحت زیر منحنی مشخصۀ عملکرد سیستم مرجع برای طبقۀ c_i است ]35 -32[ .
4 -3. عملکرد طبقهبندها
تکنیکهای هوش محاسباتی پیشنهادی در پژوهش انجامشده، در نرمافزار متلب، طراحی و پیادهسازی شدهاند. برای مقایسۀ روشهای پیشنهادی در پژوهشهای انجامشده برای طبقهبندی از پارامترهای ارزیابی یکسان استفاده شده است. با توجه به فراوانی دادههای هر کلاس، میانگین وزندار دادهها در نظر گرفته شده و در تابع فیتنس اعمال شده است. منحنی مشخصۀ عملکرد سیستم برای همۀ روشها رسم شده است و برای اعتبارسنجی سیستمها، دادهها با روش اعتبارسنجی تقاطعی 10 بخشی به دو قسمت آموزش و تست تقسیمبندی شدهاند. میانگین مقدار سطح زیر منحنی مشخصۀ عملکرد سیستم روی دادههای آموزش و تست با 10 تکرار از اجرای روش اعتبارسنجی تقاطعی 10 بخشی با انتخاب تصادفی برای هر بخش به دست آمده است. ماتریس کانفیوژن نیز برای همۀ روشها برای مقایسۀ تشخیصهای درست و نادرست سیستم بهازای خروجیها آورده شده است.
برای ارزیابی مدلهای پیشنهادی از مقایسۀ اطلاعات تصاویر ماموگرافی واقعی بیماران که رادیولوژیست زیرنویسی کرده، با نتایج سیستمها بهرهگیری شده است. پارامترهای عملگرهای روشهای بهینهسازی بهصورت اکتشافی با آزمایش مقادیر منطقی در محدودۀ مجاز آنها برای تنظیم پارامترها انتخاب شده است.
4 -3 -1.عملکرد طبقهبند فازی
سیستم استنتاج فازی در حالت سوگنو طراحی شده است. پارامترهای تنظیمشده برای طراحی سیستم فازی در جدول 3 آورده شدهاند. توابع عضویت متناظر با هر عبارت زبانی ورودی، قبل از فرایند تنظیم پارامترهای توابع عضویت سیستم فازی سوگنو در شکل 5 مشاهده میشود.
جدول (3): پارامترهای سیستم فازی
Breast Cancer Diagnosis FisName
Sugeno FisType
Min AndMethod
Max OrMethod
Prod ImpMethod
Max AggMethod
Wtaver DefuzzMethod
شکل 6، شکل توابع عضویت ورودیهای سیستم استنتاج فازی سوگنو را برای تشخیص سرطان سینه نشان میدهد. نوع خروجی در سیستم استنتاج فازی سوگنو عدد ثابت است. رادیولوژیست، پارامترها و عبارتهای زبانی مرتبط با هر متغیر از اطلاعات استخراجشده از تصاویر را تعیین کرده است.
4 -3 -2. عملکرد طبقهبند فازی - مبتنی بر آموزش و یادگیری
مدلهای پیشنهادی در پژوهش در محیط متلب و روی سیستم با پردازنده Core i5، با 2 مگابایت حافظه داخلی، پیادهسازی و اجرا شده است.
پارامترهای توابع عضویت سیستم استنتاج فازی سوگنو با الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری تنظیم شده است. تعداد جمعیت، تعداد نسل و تعداد معلم در جدول 4 آورده شدهاند. مقادیر مختلف برای تعیین تعداد معلم (با روش سعی و خطا) برای الگوریتم مبتنی بر آموزش و یادگیری آزمایش شدهاند. شکل 7، شکل توابع عضویت سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری را پس ازفرایند تنظیم پارامترها نشان میدهد. در شکل 8، بهترین و میانگین اجرای الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری برای بهینهسازی پارامترهای سیستم فازی سوگنو مشاهده میشود.
جدول (4): پارامترهای الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری برای تنظیم پارامترهای توابع عضویت
تعداد جمعیت 100
تعداد نسل 500
تعداد معلم 3
شکل (8): بهترین و میانگین اجرای الگوریتم بهینهسازی مبتنی بر آموزش و یادگیری برای بهینهسازی پارامترهای سیستم فازی سوگنو
4 -3 -3. عملکرد طبقهبند فازی - ازدحام ذرات
پارامترهای توابع عضویت سیستم استنتاج فازی سوگنو با الگوریتم بهینهسازی ازدحام ذرات، تنظیم و در جدول 5 آورده شدهاند. در پژوهش حاصل، ساختار ذرات بهصورت برداری از پارامترهای توابع عضویت سیستم فازی (گوسین و واریانس) متناسب با هر متغیر زبانی (متناظر با سیستم فازی) تعریف شده است. شکل 9، شکل توابع عضویت سیستم فازی سوگنو - ازدحام ذرات را پس از فرایند تنظیم پارامترها نشان میدهد. در شکل 10، بهترین و میانگین اجرای الگوریتم ازدحام ذرات برای بهینهسازی پارامترهای سیستم فازی سوگنو مشاهده میشود.
جدول (5): پارامترهای الگوریتم بهینهسازی ازدحام ذرات برای تنظیم پارامترهای توابع عضویت
100 تعداد جمعیت
500 تعداد نسلها
72/0 اینرسی وزن
49/1 ضریب یادگیری شخصی ذرات
49/1 ضریب یادگیری جمعی ذرات
شکل (10): بهترین و میانگین اجرای الگوریتم ازدحام ذرات برای بهینهسازی پارامترهای سیستم فازی سوگنو
4 -3 -4. عملکرد طبقهبند فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات
پارامترهای توابع عضویت سیستم استنتاج فازی سوگنو با ترکیب الگوریتمهای مبتنی بر آموزش و یادگیری و بهینهسازی ازدحام ذرات تنظیم شدهاند. پارامترهای الگوریتمهای ترکیبی در جدول 6 آورده شدهاند. شکل 11، شکل توابع عضویت سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری - ازدحام ذرات را پس از فرایند تنظیم پارامترها نشان میدهد. در شکل 12، بهترین و میانگین اجرای الگوریتم مبتنی بر آموزش و یادگیری - ازدحام ذرات برای بهینهسازی پارامترهای سیستم فازی سوگنو مشاهده میشود.
جدول (6): پارامترهای الگوریتم ترکیبی مبتنی بر آموزش و یادگیری و بهینهسازی ازدحام ذرات برای تنظیم پارامترهای توابع عضویت
تعداد جمعیت 50
تعداد نسلها در الگوریتم مبتنی بر آموزش و یادگیری 500
تعداد تکرار الگوریتم ازدحام ذرات بهازای اجرای هر نسل از الگوریتم مبتنی بر آموزش و یادگیری 50
اینرسی وزن 72/0
ضریب یادگیری شخصی ذرات 49/1
ضریب یادگیری جمعی ذرات 49/1
شکل (12): بهترین و میانگین اجرای الگوریتم مبتنی بر آموزش و یادگیری - ازدحام ذرات برای بهینهسازی پارامترهای سیستم فازی سوگنو
4 -4. مقایسۀ کارایی روشهای پیشنهادی در پژوهش حاضر
مقایسۀ تحلیل نتایج روشهای پیشنهادی با معیارهای منحنی مشخصۀ عملکرد سیستم در فرایند بهینهسازی پارامترهای توابع عضویت سیستم فازی روی کل دادهها به تعداد 295 نمونه در جدول 7 مشاهده میشود.
نمودارهای همزمان منحنی مشخصه عملکرد سیستم مربوط به روشهای هایبریدی پیشنهادی برای بهینهسازی پارامترهای توابع عضویت سیستم استنتاج فازی سوگنو پیشنهادی در شکل 13 مصوّر شده است.
جدول 8، مقایسۀ تحلیل نتایج ماتریس کانفیوژن روشهای هایبریدی پیشنهادی را در فرایند بهینهسازی پارامترهای توابع عضویت سیستم فازی سوگنو نشان میدهد. نتایج بهدستآمده از ماتریس کانفیوژن نشان میدهد روش هایبریدی فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی دارای عملکرد بهتری نسبت به روشهای پیشنهادی دیگر برای تشخیص سرطان سینه است؛ زیرا تعداد تشخیصهای درست در این روش نسبت به روشهای دیگر بیشتر است.
از روش اعتبارسنجی تقاطعی 10 بخشی برای ارزیابی مراحل آموزش و تست روشهای پیشنهادی استفاده شده است. میانگین و انحراف معیار نتایج آموزش و تست حاصل از اجرای آن برای روشهای هایبریدی پیشنهادی پس از بهینهسازی پارامترهای توابع عضویت سیستم فازی سوگنو در جدول 9 نشان داده شده است.
با توجه به جداول بالا و مقدار سطح زیر نمودار، نتایج حاصل از اجرای معیارهای منحنی مشخصۀ عملکرد سیستم و اعتبارسنجی تقاطعی 10 بخشی نشان میدهد روش هایبریدی فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی از عملکرد بهتر نسبت به روشهای هایبریدی پیشنهادی دیگر برای تشخیص سرطان سینه در بهینهسازی پارامترهای توابع عضویت سیستم استنتاج فازی پیشنهادی برخوردار است. درخور ذکر است هر یک از مدلهای پیشنهادی به نحوی سیستم را بهبود بخشیدهاند.
روشهای ارائهشده در تشخیص سرطان سینه روی پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی توسط دیگران با تکنیکهای برتر هوش محاسباتی پیشنهادی در این پژوهش در جدول 10 مقایسه شده است. براساس مطالعات انجامشده روی پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی، روشهای بررسیشده از ماشین بردارهای پشتیبان، روشهای رگرسیون، یادگیری ماشین و سیستم ایمنی مصنوعی را برای طبقهبندی تودههای سینه استفاده کردهاند. متغیرهای ورودی و خروجی در این روشها مشخص شده است. در بیشتر روشها ارزیابی براساس میزان صحت انجام شده است. مدل حاضر در مقایسه با سایر مدلهای پیشنهادی در پژوهشهای قبلی بهبود کارایی داشته است.
نتیجهگیری و پیشنهادات آتی
با وجود گسترش و پیشرفت تکنولوژی موجود در تشخیص و درمان، سرطان سینه هنوز دومین علت مرگومیر بعد از سرطان ریه است. تنها راه ممکن برای نجات زندگی بیماران تشخیص زودهنگام بیماری است؛ زیرا اگر این بیماری در مراحل اولیه و با میزان صحت بالا تشخیص داده شود، شانس زندهماندن فرد افزایش پیدا میکند. در پژوهش حاضر، یک سیستم همیار کامپیوتر به کمک تشخیص پزشکی برای شناسایی و طبقهبندی تودهها به موارد نرمال، خوشخیم و بدخیم با تکنیکهای متفاوت محاسبات نرم مبتنی بر فازی پیشنهاد شده است. از مزایای اصلی این پژوهش در مقایسه با دیگر مطالعات انجامشده روی پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی، تعداد ویژگیهای ورودی کمینه در سیستم پیشنهادی است که رادیولوژیست، ویژگیهای ورودی در سیستمهای پیشنهادی را بهصورت دستی و دقیق استخراج میکند و موقعیت و اندازۀ تودهها با توجه به اطلاعات استخراجشده تعیین میشود و این امر از پیچیدگی سیستم میکاهد. در صورتی که در بیشتر روشهای دیگر از تکنیکهای پردازش تصویر برای استخراج ویژگیها از تصاویر دارای سطح بالای نویز استفاده شده است. در روشهای پیشنهادی روشهای جدید و استفاده از الگوریتمهای مختلف بهینهسازی کارا و نوین با توجه به اندازۀ نمونۀ داده، زمان پردازش و نرخ طبقهبندی با میزان صحت بالا برای تنظیم پارامترهای سیستمهای مبتنی بر فازی برای مدیریت منابع عدم قطعیت برای چیرهشدن به محدودیتها و مشکلات در تشخیص سرطان سینه انجام شده است. از معیارهای اطمینانبخش برای سنجش کارایی سیستمها استفاده و نتایج، اعتبارسنجی شده است. نتایج بهدستآمده نشان میدهند روشهای پیشنهادی در این پژوهش به نرخ صحت طبقهبندی رقابتپذیر با سایر روشهای قبلی ارائهشده دست یافتهاند و روش هایبریدی فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات صحت عملکرد طبقهبندی در تشخیص سرطان سینه را نسبت به سایر روشهای قبلی ارائهشده بهبود داده است.
با توجه به اینکه رادیولوژیست و اطلاعات تصاویر پزشکی، ویژگیهای ورودی را در سیستمهای پیشنهادی کارا استخراج کردهاند، پیشنهاد میشود برای اتوماتیککردن فرآیند طبقهبندی سیستم، از روشهای پردازش تصاویر بهمنظور استخراج ویژگی از تصاویر پزشکی استفاده شود و نتایج با سیستمهای معرفیشده ارزیابی شود. همچنین سیستمهای پیشنهادی را میتوان روی پایگاه دادههای جمعآوریشده از مراکز معتبر درمانگاهی دیگر با تعداد دادههای بیشتر اجرا کرد. با توجه به مختصات تعیینشده از مرکز تودهها در تصاویر ماموگرافی گرفتهشدۀ رادیولوژیست، موقعیت تودهها در نواحی چهارگانۀ سینه با روشهای اتوماتیک به دست میآید. بهمنظور بهبود عملکرد سیستم، میتوان قوانین را نیز با استفاده از الگوریتمهای بهینهسازی آموزش داد. همچنین میتوان از توابع عضویت مختلف و ترکیبی برای بهبود عملکرد سیستم استفاده کرد.
شکل (1): روشهای استفادهشده در پژوهش حاضر
شکل (2): فلوچارت اجرای الگوریتم فازی - مبتنی بر آموزش و یادگیری پیشنهادی
شکل (3): فلوچارت اجرای الگوریتم فازی - ازدحام ذرات پیشنهادی
شکل (4): فلوچارت اجرای الگوریتم فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی
(ب)
(الف)
(ج)
شکل (5): نمونهای از تصاویر ماموگرافی پایگاه داده انجمن تجزیهوتحلیل تصاویر ماموگرافی، الف) ویژگی بافت زمینه سینۀ غدههای متراکم و شدت غیرعادی بودن، نرمال، ب) ویژگی بافت زمینه سینه چربیسان، طبقۀ غیرعادی بودن عدم تقارن و شدت غیرعادی بودن بدخیم، ج) ویژگی بافت زمینه سینۀ غدههای چربیسان، طبقۀ غیرعادی بودن کج و کولگی و شدت غیرعادی بودن خوشخیم
(الف)
(ب)
(ج)
(د)
شکل (6): توابع عضویت سیستم استنتاج فازی سوگنو قبل از فرایند تنظیم پارامترها، الف) تابع عضویت ویژگی بافت زمینه شامل 3 عبارت زبانی چربی سان، غدههای چربیسان و غدههای متراکم، ب) تابع عضویت نوع توده شامل 7 عبارت زبانی انباشتگی آهکی، واضح، سوزنی شکل، نامعلوم، کج و کولگی، عدم تقارن و نرمال، ج) تابع عضویت اندازۀ توده شامل 3 عبارت زبانی کوچک، متوسط و بزرگ، د) تابع عضویت موقعیت توده شامل 4 عبارت زبانی فوقانی داخلی، تحتانی داخلی، فوقانی خارجی، تحتانی خارجی
(ب)
(الف)
(د)
(ج)
شکل (7): توابع عضویت سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری پس از فرایند تنظیم پارامترها، الف) تابع عضویت ویژگی بافت زمینه، ب) تابع عضویت نوع توده، ج) تابع عضویت اندازۀ توده، د) تابع عضویت موقعیت توده
شکل (9): توابع عضویت سیستم فازی سوگنو - ازدحام ذرات پس از فرایند تنظیم پارامترها، الف) تابع عضویت ویژگی بافت زمینه، ب) تابع عضویت نوع توده، ج) تابع عضویت اندازۀ توده، د) تابع عضویت موقعیت توده
شکل (11): توابع عضویت سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری - ازدحام ذرات پس از فرایند تنظیم پارامترها، الف) تابع عضویت ویژگی بافت زمینه، ب) تابع عضویت نوع توده، ج) تابع عضویت اندازۀ توده، د) تابع عضویت موقعیت توده
شکل (13): نمودارهای منحنی مشخصۀ عملکرد مربوط به روشهای هایبریدی پیشنهادی برای بهینهسازی پارامترهای توابع عضویت سیستم استنتاج فازی سوگنو پیشنهادی
جدول (7): مقایسۀ تحلیل نتایج روشهای پیشنهادی با معیارهای منحنی مشخصۀ عملکرد سیستم در فرایند بهینهسازی پارامترهای توابع عضویت سیستم فازی روی کل دادهها
روشها صحت
Accuracy% سطح زیر منحنی
AUC% ویژگیSpecificity% بازه اطمینانCI% خطای استانداردSE پیچیدگی زمانی (ثانیه) دقتPrecision% حساسیتRecall% Fscore%
فازی 71/82 93/68 15/55 ] 54/77 33/60[ 04/0 ………… .................... .................. ....................
فازی - مبتنی بر آموزش و یادگیری 92/94 82/90 73/76 ]100 68/80[ 05/0 662/61 04/89 76/87 10/88
فازی - ازدحام ذرات 58/94 23/90 88/85 ]100 14/80[ 05/0 925/70 57/87 34/87 42/87
فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات 27/96 26/93 24/90 ]100 92/82[ 05/0 513/752 93/92 74/90 12/91
جدول (8): مقایسۀ تحلیل نتایج ماتریس کانفیوژن روشهای هایبریدی پیشنهادی در فرایند بهینهسازی پارامترهای توابع عضویت سیستم فازی
FN FP TN TP روشها
. 51 209 35 فازی
. 15 209 71 فازی - مبتنی بر آموزش و یادگیری
0 16 209 70 فازی – ازدحام ذرات
0 11 209 75 فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات
جدول (9): میانگین و انحراف معیار نتایج آموزش و تست روش اعتبارسنجی تقاطعی 10 بخشی برای روشهای هایبریدی پیشنهادی پس از بهینهسازی پارامترهای توابع عضویت سیستم فازی سوگنو
روشها صحت
Accuracy% مساحت زیر منحنی
AUC% ویژگی Specificity% بازه اطمینان 95% CI% خطای استاندارد SE
آموزش تست آموزش تست آموزش تست آموزش تست آموزش تست
فازی - مبتنی بر آموزش و یادگیری 92/94σ= 003/0 92/94σ=033/0 82/90σ=006/0 77/90σ=064/0 72/86σ=009/0 63/86σ=095/0 ]100 12/80[
]0 006/0 σ= [ ]100 74/63[
σ=[0 054/0] 05/0σ=0002/0 13/0σ=006/0
فازی - ازدحام ذرات 57/94σ*=004/0 57/94σ=043/0 22/90σ=008/0 22/90σ=080/0 87/85σ=012/0 87/85σ=117/0 ]95/99 58/79[
σ= [001/0 008/0] ]98/99 34/63[
σ=[0 192/0] 05/0σ=0003/0 13/0σ=068/0
فازی - مبتنی بر آموزش و یادگیری - ازدحام ذرات 27/96σ=004/0 27/96σ=037/0 25/93σ=007/0 18/93σ=068/0 24/90σ=010/0 10/90σ=099/0 ]100 35/82[
σ=[0 007/0] ]100 39/70[
σ=[0 226/0] 05/0σ=0003/0 11/0σ=085/0
σ*: انحراف معیار است.
جدول (10): مقایسهای از روشهای ارائهشده در تشخیص سرطان سینه روی پایگاه دادۀ انجمن تجزیهوتحلیل تصاویر ماموگرافی از دیگران با تکنیکهای برتر هوش محاسباتی پیشنهادی در این پژوهش
روش متغیرها ارزیابی(%)
قطعهبندی تصاویر ماموگرافی با روش بهینهسازی ازدحام ذرات و طبقهبندی تودههای نرمال و غیرنرمال با ماشین بردار پشتیبان]13[ ورودی: 107 ویژگی استخراجشده از مرحلۀ استخراج ویژگی
خروجی: نرمال و غیرنرمال 87/83
(براساس میزان صحت)
سیستم فازی ژنتیک مبتنی بر انتخاب ویژگی موجک هم رخداد در طبقهبندی ماموگرام برای تشخیص سرطان سینه]14[ ورودی: 16 ویژگی استخراجشده از مرحلۀ استخراج ویژگی
خروجی: 1. انباشتگی آهکی 2. واضح 3. سوزنی شکل 4. نامعلوم 5. کج و کولگی 6. عدم تقارن 7. نرمال 47/89
(براساس میزان صحت)
شناسایی ضایعه در تصاویر ماموگرافی با استفاده از تکامل تفاضلی مبتنی بر خوشهبندی اتوماتیک فازی ]15[ ورودی: تصویر
خروجی: شناسایی توده در تصویر گزارش نشده است
استخراج ویژگی با روش آنتروپی انرژی موجک و طبقهبندی با رگرسیون خطی ]16[ ورودی: ویژگیهای استخراج شده از مرحلۀ استخراج ویژگی
خروجی: نرمال و غیرنرمال 85/91
(براساس میزان صحت)
مدل طبقهبندی سازگار مبتنی بر سیستم ایمنی مصنوعی برای شناسایی سرطان سینه ]17[ ورودی: ویژگیهای استخراجشده از مرحلۀ استخراج ویژگی
خروجی: نرمال و نامتقارن 85
(براساس میزان صحت)
سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری پیشنهادی ورودی: 4 ویژگی استخراجشده از تصویر گرفتهشدۀ رادیولوژیست
خروجی: خوشخیم، بدخیم و نرمال 92/94
(براساس میزان صحت)
سیستم فازی سوگنو – ازدحام ذرات پیشنهادی ورودی: 4 ویژگی استخراجشده از تصویر گرفتهشدۀ رادیولوژیست
خروجی: خوشخیم، بدخیم و نرمال 58/94
(براساس میزان صحت)
سیستم فازی سوگنو - مبتنی بر آموزش و یادگیری - ازدحام ذرات پیشنهادی ورودی: 4 ویژگی استخراجشده از تصویر گرفتهشدۀ رادیولوژیست
خروجی: خوشخیم، بدخیم و نرمال 27/96
(براساس میزان صحت)
سپاسگزاری
بر خود لازم میدانم از جناب آقای دکتر سعید گیتیفروز در تجزیهوتحلیل و تفسیر اطلاعات برای به ثمر رساندن این پژوهش قدردانی و تشکر کنم.