نوع مقاله : مقاله پژوهشی فارسی
نویسندگان
1 - کارشناسی ارشد برق الکترونیک، دانشکده مهندسی برق و کامپیوتر- دانشگاه بیرجند- بیرجند- ایران
2 - استادیار گروه برق الکترونیک، دانشکده مهندسی برق و کامپیوتر- دانشگاه بیرجند- بیرجند- ایران
چکیده
کلیدواژهها
عنوان مقاله [English]
نویسندگان [English]
In recent years the use of intelligent systems in science and engineering, especially in the diagnosis of disease, is increasingly growing. In this paper a smart way to diagnose heart disease (cardiac arrhythmias) is presented. This method is based on a combination of structures using neural networks for classification of normal operation and four abnormal heart functions. In the combination of these structures, some neural networks as a mediator, and some of them have been used as a specialist. In the proposed method firstly for removing noise from ECG signal, preprocessing was performed. The various time features (including fifteen properties) and wavelet features (includes fifteen feature) are extracted from the noise free signal and given the large number of selected features, principal components analysis is used for feature reduction to eight features. The proposed structures of MLP neural networks and RBF neural networks are appropriately trained for classification of arrhythmias and their performance has been evaluated. The results of the implementation of the proposed method on MIT / BIH database show the better performance in the diagnosis of cardiac arrhythmias compared to previous approaches.
کلیدواژهها [English]
قلب یکی از مهمترین اعضای بدن است که وظیفه پمپ کردن خون در سیستم قلبی عروقی را بهعهده دارد. چنانچه عملکرد قلب از نظم طبیعی (ریتم) خود خارج شود، گردش خون بهخوبی انجام نمیشود و این امر میتواند خطرهای جدی برای فرد بهدنبال داشته باشد. از اینرو، تشخیص درست و بموقع آریتمیهای قلبی از اهمیت بهسزایی برخوردار است. یکی از راههای شناخته شده برای تشخیص بموقع این آریتمیها بررسی فعالیتهای الکتریکی قلب با استفاده از سیگنالهای الکتروکاردیوگرافی (ECG) است. تغییرات معنیداری از ساختار قلب بیماران و ضربانهای آن با استفاده از این سیگنالها قابل تشخیص هستند. از جمله نارساییهای قابل تشخیص با استفاده از سیگنال الکتروکاردیوگرافی میتوان تاکیکاردی[1]، برادیکادری[2]، هیپرتروفی[3] و آنفارکتوس[4]های قلبی را نام برد ]2,1[.
برای طراحی یک سیستم هوشمند تشخیص آریتمیهای قلبی از روی سیگنالهای الکتروکاردیوگرافی، لازم است ابتدا ویژگیهای مناسبی از روی این سیگنالها استخراج شود. در منابع مختلف، روشهای متنوعی برای استخراج ویژگیهای مناسب پیشنهاد شده است.
در مرجع ]3[ نشان داده شده است که تغییرات در شکل مجموعه QRS، باعث تغییر در سری K-L[5] خواهد شد. به این ترتیب، از بسط K-L بهعنوان یک ابزار جهت تحلیل پریودهای ایسکمی استفاده شده است.
با اعمال فیلتر بانک روی اجزای مختلف سیگنالهای الکتروکاردیوگرافی، میتوان ویژگیهای حوزه زمان این سیگنال را بهصورت سادهتری بیان کرد و یا به عبارتی دیگر، ویژگی جدیدی روی خروجیهای فیلتر بانک تعریف کرد [4].
در مرجع [5] برای کاهش ابعاد فضای ویژگی از روش تحلیل مؤلفههای اصلی[6] استفاده شده و با انتخاب ده مؤلفه اول این روش بهعنوان ورودی یک طبقهبندی کننده، آریتمی و ایسکمی[7] از حالت نرمال قلب تشخیص داده شده است.
در مرجع ]6[ برای شناسایی آریتمی بطنی، فیبریلاسیون[8] و پتانسیلهای تاخیری، از ویژگیهای سیگنال الکتروکاردیوگرافی در حوزه فرکانس استفاده شده است. انرژی سیگنال، طیف فرکانسی سیگنال، طیف توان سیگنال، ضرایب بسط AR [9] و مدل ARX[10] از جمله ویژگیهای استفاده شده در این مرجع هستند.
چندجملهای چبیشف از دیگر ابزارهایی است که برای بهدست آوردن ویژگیهای موجود در سیگنالهای الکتروکاردیوگرافی استفاده شده است. برای این منظور، سیگنال قلبی بهوسیله توابع متعامد مدل شده و ضرایب و ماندههای این بازنمایی بهعنوان ویژگیهای مناسبی برای تشخیص آریتمیهای قلبی انتخاب شدهاند [7].
از دیگر روشهایی استخراج ویژگی، استفاده از همبستگی و ماتریس کواریانس سیگنالهای الکتروکاردیوگرافی است. این روش در زمرهی روشهای آماری برای استخراج ویژگی است. در این روشها میتوان با استفاده از این نکته که برخی ویژگیهای حوزه زمان، از نظر رخداد تصادفی هستند یا خیر، به شناسایی بیماریهای قلبی پرداخت [8].
ویژگیهای زمان-فرکانس، از جمله دیگر ویژگیهای مورد استفاده برای تشخیص آریتمیهای قلبی است. با استفاده از این ویژگیها میتوان مشخص کرد که یک بازه فرکانسی مشخص (ویژگیهای حوزه فرکانس) در چه بازه زمانی (ویژگیهای زمانی) رخ میدهد. برای انتخاب ویژگی یا تعریف ویژگیهای جدید، حوزه زمان - فرکانس، حوزه غنیتری است و این امر در ماهیت ناایستای سیگنال قلبی ریشه دارد [9].
پس از استخراج ویژگیهای مناسب از سیگنالهای الکتروکاردیوگرافی، لازم است از یک طبقهبندی کننده مناسب برای تشخیص آریتمیهای مختلف قلب استفاده شود.
شبکههای عصبی، از جمله پرکاربردترین و موفقترین طبقهبندی کنندهها هستند که در طبقهبندی آریتمیهای مختلف قلبی نیز بهطور گستردهای استفاده شدهاند.
روشهای متعددی برای بهبود کارایی یک طبقهبندی کننده وجود دارد. بهعنوان نمونه در مرجع [12] نشان داده شده است که استفاده از الگوریتم جستجوی ذرات چند بعدی (MD-PSO) قادر است وزندهی شبکه عصبی پرسپترون چند لایه را به نحو بهتری انجام دهد و بهعبارتی، آموزش بهتری برای شبکه مهیا کند. با این روش پنج آریتمی قلبی پایگاه داده MIT/BIH با نرخ بازشناسی4/92% طبقهبندی شده است. در مرجع [11] نشان داده شده است که ادغام ویژگیهای موجک و ویژگیهای زمانی و استفاده از مجموعه غنی از دادهها باعث بالا رفتن دقت تشخیص ضربان زودهنگام بطنی توسط شبکه عصبی پرسپترون چند لایه میشود. سیستم پیشنهادی در این مرجع نهایتا دقتی برابر با 16/95%گزارش کرده است. در برخی از منابع نیز سعی شده که از مفاهیم مطرح شده در بحث ترکیب طبقهبندی کنندهها برای بهبود نتایج کمک گرفته شود. در مرجع [10] با استفاده از طبقهبندی کننده عصبی چند مرحلهای متشکل از دو ساختار شبکه عصبی پرسپترون چند لایه و شبکههای عصبی خودسازمانده (SOM)، شش آریتمی قلبی پایگاه داده MIT/BIH، با میانگین نرخ بازشناسی 3/88% طبقهبندی شده است.
یادگیری دستهجمعی در قالب ادغام نتایج چند طبقهبندی کننده و ایجاد یک سیستم ترکیبی برای طبقهبندی، رویکرد مؤثری در یادگیری ماشینی است و بهطور معمول باعث بالا رفتن دقت طبقهبندی میشود [13]. دو دسته کلی برای این ساختارهای ترکیبی تا کنون ارائه شدهاند: دسته اول ساختارهای ایستا هستند. در این دسته، طبقهبندی کنندههای پایه بهگونهای تعبیه میشوند که در آنها از سیگنالهای ورودی برای طبقهبندی استفاده نمیشود. دسته دوم ساختارهای پویا هستند که در آنها طبقهبندی بر اساس تاثیر مستقیم طبقهبندی کنندههای پایه انجام میشود ]25 [.
یک ساختار ترکیبی از طبقهبندی کنندهها دارای سه مشخصه اصلی است. اول اینکه در این ساختار هیچ طبقهبندیکننده اضافی موجود نیست؛ دوم اینکه از نظر ساختاری، طبقهبندی کنندههایی با ساختارهای منحصر بهفرد و غیر قابل تغییر استفاده نشده باشد و در نهایت اینکه سیستم ترکیبی دقت بازشناسی را افزایش داده یا عملکرد بهتر و سریعتری داشته باشد ]24.[ از اینرو، بهطور معمول، طبقهبندی کنندهها در یک ساختار موازی سازماندهی میشوند ]27,26[. این در حالی است که در این تحقیق سعی شده است که ساختار ترکیبی ارائه شده بهگونهای مدلی از روند تشخیص بیماری توسط پزشک باشد؛ به این ترتیب که ابتدا ساختار میانجی بهعنوان مدلی از پزشک عمومی یک طبقهبندی اولیه روی دادهها انجام میدهد. در ادامه، ساختار متخصص بهعنوان مدلی از پزشک متخصص ابهامهای موجود در تصمیم ساختار میانجی را برطرف میکند.
پیکربندی مقاله به این صورت است که در بخش دوم توضیحاتی درباره دادههای مورد استفاده در این تحقیق ارائه شده است. بخش سوم شامل مطالبی در مورد پیشپردازشهای انجام شده روی دادهها است. بخش چهارم انواع ویژگیهای استخراج شده از سیگنالهای الکتروکاردیوگرافی و ادغام این ویژگیها با استفاده از تحلیل مولفههای اصلی را بیان میکند. در بخش پنجم ساختارهای پیشنهاد شده برای تشخیص آریتمیهای قلبی ارائه و ارزیانی شدهاند. بخش ششم نیز به بحث و نتیجهگیری اختصاص یافته است.
در این تحقیق از سیگنالهای الکتروکاردیوگرافی برچسب خورده پایگاه داده MIT-BIH-Arrhythmia استفاده شده است. این پایگاه داده شامل 48 ثبت ECG دو کاناله است که از 47 مورد مطالعاتی در لابراتوار آریتمی BIH بین سالهای 1975 تا 1979 بهدست آمده است. ثبتها با فرکانس 360 نمونه بر ثانیه رقومی و با دقت یازده بیت در محدوده ده میلیولت ذخیره شدهاند. هر ثبت توسط دو یا چند متخصص قلب بهطور مستقل علامتگذاری و تفاوت در اظهار نظرها به بهترین روش رفع شده است. این پایگاه داده یکی از معتبرترین مراجع برای تحلیل بر روی بیماریهای قلبی در دنیا محسوب میشود ]14[.
بیشتر دادههای بهدست آمده از ثبت ECG، بهخاطر تأثیرات محیطی و یا فرآیندهای مربوط به ثبت دادهها و نوسانهای برق شهر نویزی میشوند. نویزهایی که در دادههای مورد استفاده در این تحقیق بهصورت مستمر تکرار میشوند، شامل دونوع نویز تصادفی ناشی از برق شهر و انحراف خط زمینه است.
این نویز، یک نویز باند باریک در فرکانس 50 یا 60 هرتز و با پهنای باند کمتر از یک هرتز است که با سیگنال ECG ترکیب شده و سیگنالی با فاز اولیه تصادفی ایجاد میکند. دامنه این نویز 50% دامنه پیک تا پیک سیکنال الکتروکاردیوگرافی است. شکل(1) نمونهای از سیگنال الکتروکاردیوگرافی آلوده به نویز در یک دوره شامل 40 ضربان قلب را نشان میدهد [15].
برای حذف نویز برق شهر از سیگنال الکتروکاردیوگرافی، یک فیلتر باترورث چهار قطب با ساختار پایینگذر و فرکانس قطع نرمالیزه شده 0.1 () استفاده شده است شکل(2). با این فیلتر، ضربانهای نویزی با منشا خارجی و همسایههای آنها پسزده میشود [15,23].
شکل(1): دوره شامل 40 ضربان قلب آلوده به نویز تصادفی
شکل(2): فیلتر باترورث استفاده شده برای حذف نویز ناشی از برق شهر
2-1-2- نویز ناشی از انحراف خط زمینه
این نویز دارای فرکانس پایین و در حدود 15/0 تا 3/0 هرتز است و از نفسکشیدن در هنگام ثبت سیگنال الکتروکاردیوگرافی ناشی میشود. این نویز باعث میشود خط زمینه سیگنال الکتروکاردیوگرافی تغییر کند و در نتیجه، استخراج مشخصهها و ویژگیهای زمانی سیگنال با مشکل مواجه شود. شکل(3) نمونهای از این نویز را در یک دوره چهلتایی از ضربان قلب را نشان میدهد.
نویز انحراف از خط زمینه با استفاده از تبدیل موجک گسسته حذف شده است. با توجه به اینکه انحراف ایجاد شده در خط زمینه در مقایسه با سیگنال الکتروکاردیوگرافی دارای فرکانس کمتری است، انتظار میرود سیگنال تقریب نشاندهنده خط زمینه باشد و بنابراین در تجزیه سیگنال الکتروکاردیوگرافی تا چهار سطح، سیگنال a4 با تقریب خوبی نشاندهنده سیگنال خط زمینه خواهد بود. بنابراین، با حذف سیگنال تقریب و بازسازی مجدد سیگنال با استفاده سیگنالهای جزئیات d1 تا d4 سیگنال الکتروکاردیوگرافی فاقد انحراف در خط زمینه بازیابی میشود شکل(4) [16].
شکل(3): دوره شامل 40 ضربان قلب آلوده به نویز انحراف از خط زمینه
شکل(4): دوره شامل 40 ضربان قلب پس از حذف نویز انحراف از خط زمینه
برای هر سیگنال الکتروکاردیوگرافی موجود در پایگاه داده، آریتمیهای مختلف و نیز تفسیری که توسط متخصصان قلب بر روی آن صورت گرفته است، نیز موجود است. با توجه به اینکه ممکن است یک سیگنال در زمانهای مختلف نشاندهنده وجود بیماریهای متفاوت باشد، لازم است قطعاتی از سیگنال که حاوی یک بیماری خاص هستند جدا شوند. این امر باعث افزایش دقت تشخیص سیستم خواهد شد.
اطلاعات موجود در پایگاه داده حاکی از این است که نرخ ضربانهای قلبی در برخی از سیگنالهای ثبت شده در سه دوره متوالی تغییر میکند. بنابراین، برای هر بیماری، سه دوره متوالی از سیگنال الکتروکاردیوگرافی در محل وقوع بیماری به عنوان داده مورد نظر برای این بیماری انتخاب شده است. در شکل(5) نمونههای سیگنالهای حاوی بیماریهای انسداد دسته شاخه چپ (LBBB)، انقباض قبل از بطنی (PVC)، انسداد دسته شاخه راست (LBBB) و تاکیکاردی فوق بطنی (SVT) به همراه کارکرد طبیعی (Normal Beat) نشان داده شدهاند. در این تحقیق، پنج دسته سیگنال ذکر شده بهعنوان کلاسهای مختلف بیماری در نظر گرفته شدهاند.
شکل (5): سیگنالهای ECG مورد نظر طی اعمال مرحله قطعهبندی
در مرحله استخراج ویژگی، دادهها به وسیله تبدیلهای خطی یا غیرخطی به فضای ویژگی با ابعاد کمتر انتقال مییابند. سیستم تشخیص بیماری مشابه پزشک متخصص برای تشخیص آریتمیهای قلبی به اطلاعاتی در مورد ریتم قلب و مورفولوژی سیگنال الکتروکاردیوگرافی نیاز دارد. بهعبارت دیگر، مشابه پزشک نیاز دارد، بداند که در چه موقعیت مکانی، چه تغییراتی (مولفههای فرکانسی) در سیگنال الکتروکاردیوگرافی موجود است. بنابراین، برای تفکیک و تشخیص آریتمیهای قلبی لازم است بردار ویژگی انتخاب شده، هم ویژگیهای زمانی و هم ویژگیهای فرکانسی را دارا باشد [28].
با توجه به اینکه ضرایب موجک قادرند اطلاعات زمان-فرکانس سیگنال را بهطور توام توصیف کنند، بهترین انتخاب برای استخراج ویژگی از یک سگنال الکتروکاردیوگرافی خواهند بود. در این راستا باید تعداد سطوح تجزیه و نوع موجک مشخص شوند. تعداد سطوح تجزیه بر اساس مولفه فرکانسی غالب سیگنال و بهگونهای انتخاب میشود که اطلاعات بخشهایی از سیگنال که با فرکانس مورد نیاز برای طبقهبندی سیگنال بهخوبی مطابقت دارند، در ضرایب موجک حفظ شوند. همچنین، نتایج تحقیقات قبلی نشان داده است که برای استخراج ویژگی از سیگنالهای الکتروکاردیوگرافی خانواده دابیچز و هار در مقایسه با سایر موجکها بسیار مناسبتر هستند [17,29].
نمونهای از سیگنال LBBB به همراه ضرایب تبدیل موجک آن تا هفت سطح تجزیه با استفاده از موجک 4db در شکل(6) نشان داده شده است. سیگنال الکتروکاردیوگرافی با فرکانس 360 نمونه بر ثانیه نمونهبرداری شده است. بنابراین، بر اساس قضیه نمونهبرداری شانون میتوان انتظار داشت که کل بازه حقیقی معرف صفر تا 180 هرتز خواهد بود. این شکل نشان میدهد که هر سطح تجزیه در مقایسه با دیگری از توزیع متمایزی برخوردار است
.
به همراه ضرایب جزئیات تا 7 هفت سطح تجزیه LBBB شکل (6): نمونهای از سیگنال
در بخش پیشپردازش اشاره شد که سطوح اولیه تجزیه موجک (Cd1, Cd2)، اطلاعات نویز فرکانس پایین در بازه صفر تا 50 هرتز را در خود دارند. نادیده گرفتن این ضرایب باعث میشود که اطلاعات ناچیزی از سیگنال از دست برود. همچنین، ضرایب برخی از سطوح میانی تجزیه موجک (Cd3, Cd4) نیز شامل اطلاعات همپوشانی شدهای هستند که باعث میشود سیگنال بازسازی شده با در نظر گرفتن این سطوح تجزیه میانی و نیز سطوح تجزیه اولیه، یک سیگنال هموار نباشد [28,29].
با در نظر گرفتن موارد ذکر شده فوق در مرحله استخراج ویژگی، از ضرایب موجک در سه سطح 5، 6 و 7 برای استخراج ویژگی استفاده شده و با استفاده از آنها 15 ویژگی فهرست شده در جدول (1) استخراج شده است. در شکل(7) ویژگیهای موجک استخراج شده برای پنج نمونه از سیگنالهای مورد بررسی مربوط به آریتمیهای مختلف نشان داده شده است. همانطور که مشاهده میشود، این ویژگیها از یکدیگر متمایز هستند.
شکل (7): ویژگیهای موجک استخراج شده برای پنج نمونه از سیگنالهای مورد بررسی مربوط به آریتمیهای مختلف
جدول(1): ویژگیهای موجک استخراج شده
تراز پنجم، ششم و هفتم |
ویژگیهای موجک |
3-1W |
Mean |
6-4W |
Var |
9-7W |
Max |
12-10W |
Median |
15-13W |
Sum(abs(·)) |
تشخیص پزشک بهطور عمده مبتنی بر اطلاعات زمانی و مورفولوژیک استخراج شده از سیگنال الکتروکاردیوگرافی است. این در حالی است که در برخی از شرایط ویژگیهای بهدست آمده از تحلیل موجک بر روی سیگنالهای قلبی، به تنهایی از تمایز کافی برای طبقهبندی برخوردار نیستند. از این رو، استفاده از دیگر مشخصههای موجود در سیگنالهای قلبی به جهت طبقهبندی بیمارهای قلبی ضروری بهنظر میرسد.
برای توصیف کاملتر سیگنال الکتروکاردیوگرافی، علاوه بر ویژگیهای موجک از ویژگیهای زمانی نیز در این تحقیق استفاده شده است. ویژگیهای زمانی مورد استفاده در این مقاله مطابق کار انجام شده در [18] ، شامل پانزده ویژگی زمانی برای تشخیص مولفههای شناختی از سیگنال ECG هستند که جزئیات دقیق محاسبه آنها در جدول (2) بیان شده است.
ویژگیهای زمانی استخراج شده برای پنج نمونه از سیگنالهای مورد بررسی مربوط به آریتمیهای مختلف در شکل(8) نشان داده شده است. همانطور که مشاهده میشود، این ویژگیها نیز از یکدیگر و از ویژگیهای موجک متمایز هستند.
شکل (8): ویژگیهای زمانی استخراج شده برای پنج نمونه از سیگنالهای مورد بررسی مربوط به آریتمیهای مختلف
جدول (2): ویژگی زمانی برای تشخیص مولفههای شناختی از ECG
توصیف ویژگی |
عنوان اختصاری |
تعریف ویژگی |
دامنه ماکزیمم سیگنال |
AMP |
|
دامنه مینیمم سیگنال |
-AMP |
|
زمان نهفتگی سیگنال |
LAT |
|
نسبت زمان نهفتگی به دامنه ماکزیمم |
LAR |
|
ناحیه مثبت |
PAR |
|
ناحیه منفی |
NAR |
|
قدر مطلق ناحیه منفی |
NANR |
|
مجموع ناحیه |
TAR |
|
قدر مطلق مجموع ناحیه |
ATAR |
|
قدر مطلق مجموع ناحیه |
TAAR |
|
پیکتاپیک سیگنال |
PP |
|
پنجره زمانی پیکتاپیک سیگنال |
PPT |
|
شیب پیکتاپیک سیگنال |
PPS |
|
محل عبور صفر |
ZC |
|
چگالی عبور صفر |
ZCD |
در بسیاری از موارد، برای یافتن دانش نهفته در دادهها، تمامی ویژگیهای استخراج شده از روی دادهها مورد نیاز نیستند. بهعبارتی با ادغام ویژگیها و یا حذف برخی از آنها اطلاعات قابل ملاحظهای از دادهها از بین نمیرود؛ ضمن اینکه زیاد بودن تعداد ویژگیها باعث بالا رفتن حجم محاسبات میشود و در بسیاری از موارد لازم است از بین ویژگیهای زیاد، دست به انتخاب بزنیم و یا اینکه ویژگیهای زیاد را با هم ادغام کرده و ویژگیهای مناسبتر و با ابعاد کمتر را بهدست آوریم. مهمترین روش برای انتخاب و ادغام ویژگی بهترتیب استفاده از الگوریتم ژنتیک و استفاده از تحلیل مؤلفههای اصلی است. در این مقاله، برای کاهش ابعاد ویژگی از روش تحلیل مولفههای اصلی استفاده شده است.
در روش تحلیل مؤلفههای اصلی، محورهای مختصات جدیدی برای دادهها تعریف میشود بهگونهای که نخستین محور در جهتی قرار میگیرد که واریانس دادهها بیشینه است و دومین محور نیز عمود بر محور اول و در جهتی که واریانس دادهها بیشینه باشد، در نظر گرفته میشود و به همین ترتیب، محورهای بعدی عمود بر تمامی محورهای قبلی به گونهای قرار میگیرند که واریانس دادهها در آن جهت بیشینه باشد [19].
این روش برای ریتم طبیعی و همچنین هر یک از ریتمهای غیر طبیعی، از بیست قطعه سیگنال الکتروکاردیوگرافی مشخص حاوی بیماری استفاده شده است. همانگونه که در بخش قبلی نیز اشاره شد، برای هر یک از این سیگنالها، پانزده ویژگی موجک و پانزده ویژگی زمانی استخراج شده است. به این ترتیب، بردار ویژگی استخراج شده دارای 30 مولفه است که با استفاده
از روش تحلیل مولفههای اصلی به هشت مولفه کاهش پیدا میکند.
ساختار ترکیبی طبقهبندی کنندهها میتواند بر اساس رویکرد همکاری طبقهبندی کنندهها و یا انتخاب یکی از طبقهبندی کنندهها طراحی شود. در ساختار مبتنی بر همکاری، مساله کلی به چند زیر مساله شکسته شده و هر زیر مساله توسط یک طبقهبندی کننده حل شده و پاسخ نهایی مساله کلی، از این پاسخها بهدست میآید [20]. نتیجهگیری نهایی در این ساختار مبتنی بر انتخاب پاسخ نهایی از انتخاب پاسخ یکی از طبقهبندی کنندهها و یا از ترکیب پاسخ چند طبقهبندی کننده منتخب بهدست میآید [21].
همانطور که پیش از این اشاره شد، در این تحقیق طراحی ساختار ترکیبی طبقهبندی کنندهها مبتنی بر منطقی است که توسط مجموعهای از پزشکان برای تشخیص بیماری دنبال میشود؛ به این ترتیب که ابتدا یک طبقهبندی کننده میانجی به عنوان مدلی از پزشک عمومی تشخیص اولیهای را ارائه میدهد. تشخیص این طبقهبندی کننده میانجی در برخی از آریتمیها پذیرفته شده، اما در برخی از آریتمیها که تشخیص طبقهبندی کننده میانجی چندان قابل اطمینان نباشد، فرآیند تشخیص در قالب یک روش سلسله مراتبی به عهده یک یا چند طبقهبندی کننده متخصص گذاشته میشود.
در ابتدا برای طبقهبندی کننده میانجی از یک شبکه عصبی استاتیکی پرسپترون (MLP) با ساختار پسانتشار خطا استفاده شده که به روش بهینهیابی Levenberg-Marquardt آموزش دیده است. این روش آموزش علیرغم اینکه نسبت به سایر الگوریتمهای موجود برای آموزش شبکه عصبی به حافظه بیشتری نیاز دارد، در بیشتر موارد برای یادگیری با نظارت بهعنوان بهترین انتخاب استفاده شود [22]. در ادامه، ساختار دیگری مبتنی شبکه عصبی پایه شعاعی جایگزین این شبکه پرسپترون چند لایه میشود تا توان طبقهبندی را افزایش دهد.
یادگیری مسائل غیرخطی مبتنی بر تصمیمگیریهای متعدد با استفاده از شبکههای عصبی چند لایه بهخوبی انجام میشود. تنظیم پارامترهای یک شبکه عصبی، از قبیل تعداد لایههای میانی و تعداد نرونهای هر یک از این لایهها، در رسیدن به بهترین نتیجه و جلوگیری از همگرایی غیر دقیق شبکه عصبی از اهمیت بسیاری برخوردار است.
با زیاد شدن تعداد لایههای میانی، شبکه قادر به درک پیچیدگیهای بیشتری خواهد بود. از نظر ریاضی در نظر گرفتن تعداد لایه میانی بیشتر به معنی افزایش توان کدگذاری و کدبرداری بین ورودیها و خروجیهاست. از طرف دیگر، افزایش بیش از حد لایههای میانی باعث پایین آمدن کارایی آموزشی شبکه میشود. تعداد نرونهای لایههای میانی نیز بهصورت حدسی و تجربی تعیین میشود. بهطور معمول، تعداد نرونهای لایههای مجاور به هم ارتباط دارد. تعداد نرونهای لایه بعدی میتواند نصف و یا چند برابر تعداد نرونهای لایه قبلی باشد.
عاملی که باید در تعیین تعداد نرونهای لایههای میانی مورد توجه قرار گیرد، ایجاد تعادل بین سرعت همگرایی و قدرت تجزیه و تحلیل شبکه است. افزایش بیش از حد تعداد گرهها سرعت همگرایی را پایین میآورد. این در حالی است که کاهش بیش از حد تعداد گرهها باعث کم شدن توان تجزیه و تحلیل شبکه و پیرو آن کم شدن قدرت پیشگویی نهایی شبکه میشود [30,31]. در این مقاله از یک شبکه عصبی پرسپترون با دو لایه میانی به عنوان شبکه میانجی استفاده شده است. در لایه ورودی به تعداد ویژگیهای استخراج شده (هشت ویژگی) و در لایه خارجی به اندازه تعداد آریتمیها (پنج دسته سیگنال) نرون در نظر گرفته شده است. در لایههای میانی نیز بهترتیب 10 و 55 نرون در نظر گرفته شده است. پارامترهای شبکه عصبی پرسپترون چند لایه استفاده شده در جدول (3) نشان داده شده است.
کارایی این شبکه در طبقهبندی آریتمیهای مختلف برای کل دادههای آموزشی در جدول (4) نشان داده شده است. مشاهده میشود که صحت عملکرد این طبقهبندی کننده 76% است. همچنین متوسط کارایی این شبکه عصبی برای دادههای آزمایشی در ده تکرار حدود 45% است.
جدول(3): پارامترهای به کار رفته در شبکه عصبی پرسپترون چند لایه
نوع پارامتر |
مقدار پارامتر |
میانگین متوسط مجذور خطا (MSE) در ده بار تکرار |
01/0 |
تعداد تکرار |
30 |
تعداد نرون ورودی |
8 |
تعداد نرونهای لایههای پنهان |
[10,55] |
تعداد نرون خروجی |
5 |
جدول(4): جدول کارایی طبقهبندی کننده پایه
SVT |
RBBB |
PVC |
NOR |
LBBB |
|
1 |
0 |
1 |
0 |
18 |
LBBB |
0 |
1 |
4 |
15 |
0 |
NOR |
1 |
0 |
15 |
3 |
1 |
PVC |
4 |
15 |
1 |
0 |
0 |
RBBB |
13 |
1 |
2 |
0 |
4 |
SVT |
با نگاه به جدول (4) مشخص است که طبقهبندی کننده در تشخیص درست آریتمی LBBB در مقایسه با سایر آریتمیها موفقتر بوده است (18 تشخیص درست در مقابل 2+5 تشخیص نادرست). بنابراین در این مورد میتوان به تشخیص طبقهبندی کننده میانجی اعتماد کرد. در تمایز دو به دوی چهار آریتمی باقیمانده، طبقهبندی کننده میانجی در تمایز بین دو آریتمی NOR و PVC بیشترین خطا را دارد (4+3 خطا). همچنین، خطای این طبقهبندی کننده در تمایز بین دو آریتمی SVT و RBBB نیز مقدار درخور توجهی است (4+1 خطا).
با توجه به مطالب گفته شده، یک رویکرد برای طراحی ساختار ترکیبی از طبقهبندی کنندهها میتواند به این صورت باشد که در مورد آریتمی LBBB نظر طبقهبندی کننده میانجی معتبر محسوب شود، اما در مورد دو آریتمی NOR و PVC و یا SVT و RBBB نظر طبقهبندی کنندههای متخصص مربوطه معتبر محسوب شود. به این ترتیب، لازم است یک طبقهبندی کننده متخصص برای تمایز بین دو آریتمی NOR و PVC و طبقهبندی کننده متخصص دیگری برای تمایز بین دو آریتمی SVT و RBBB آموزش ببینند. در طراحی ساختارهای ترکیبی مختلف و در نظر گرفتن طبقهبندی کنندههای متخصص برای رفع ابهام از تصمیم طبقهبندی کننده میانجی، باید بهگونهای عمل شود که کلاسهای مختلف آریتمیهای بهگونهای با هم ترکیب شوند که با عملیات سطری و ستونی مربوط به این کلاس ترکیبی در جدول (4)، عناصر قطری افزایش و عناصر غیر قطری کاهش یابند. بر اساس این تحلیل، دو ساختار ترکیبی زیر برای اصلاح تصمیم طبقهبندی کننده میانجی طراحی شدهاند. هر یک از طبقهبندی کنندههای میانجی و متخصص روی دادههای مربوط به خودشان آموزش داده شدهاند. 80 درصد از کل دادهها برای آموزش و 20 درصد برای آزمایش استفاده شدهاند. همچنین، در تکرارهای مختلف الگوریتم، دادههای آزمایشی بهصورت تصادفی از بین دادهها انتخاب شدهاند.
شکل (9): ساختارهای ترکیبی از شبکههای عصبی
در این ساختارها برای طبقهبندی کننده میانجی و دو طبقهبندی کننده متخصص در هر دو ساختار الف و ب از شبکههای عصبی پرسپترون چند لایه استفاده شده است. جداول (5) و (6) بهترتیب مقادیر پارامترهای شبکههای عصبی مختلف در ساختار الف و ب را نشان میدهند.
جداول کارایی ساختارهای الف و ب برای تمامی دادههای آموزشی بهترتیب بهصورت نشان داده شده در جداول (7) و (8) هستند. از روی این جداول مشخص است که صحت عملکرد این ساختارها در مقایسه با طبقهبندی کننده میانجی (نتایج نشان داده شده در جدول (4) بهتر شده و بهترتیب به 82% و 84% افزایش یافته است. متوسط کارایی این ساختارهای ترکیبی برای دادههای آزمایشی در ده تکرار نیز در مقایسه با طبقهبندی کننده پایه افزایش یافته است. این مقدار برای ساختار ترکیبی الف برابر 65% و برای ساختار ترکیبی ب برابر 60% بهدست میآید.
جدول(5): پارامترهای شبکههای عصبی پرسپترون چندلایه در ساختار الف
متخصص (N-P)(MLP) |
متخصص (R-S)(MLP) |
میانجی (MLP) |
پارامترها |
0.0045 |
0.0032 |
0.0088 |
میانگین متوسط مجذور خطا (MSE) در ده بار تکرار |
30 |
30 |
30 |
تعداد تکرار |
8 |
8 |
8 |
تعداد نرون ورودی |
10 |
10 |
10 |
تعداد نرون پنهان |
2 |
2 |
3 |
تعداد نرون خروجی |
جدول(6): پارامترهای شبکههای عصبی پرسپترون چندلایه در ساختار ب
متخصص (N-P-S)(MLP) |
متخصص (L-R)(MLP) |
میانجی (MLP) |
پارامترها |
0.0039 |
0.0002 |
0.0043 |
میانگین متوسط مجذور خطا (MSE) در ده بار تکرار |
30 |
30 |
30 |
تعداد تکرار |
8 |
8 |
8 |
تعداد نرون ورودی |
10 |
10 |
10 |
تعداد نرون پنهان |
3 |
2 |
2 |
تعداد نرون خروجی |
جدول(7): جدول کارایی مربوط به ساختار ترکیبی الف از شبکههای عصبی پرسپترون چند لایه
SVT |
RBBB |
PVC |
NOR |
LBBB |
|
0 |
0 |
2 |
0 |
18 |
LBBB |
1 |
1 |
1 |
16 |
1 |
NOR |
2 |
0 |
14 |
2 |
2 |
PVC |
1 |
19 |
0 |
0 |
0 |
RBBB |
15 |
0 |
0 |
2 |
3 |
SVT |
جدول(8): جدول کارایی مربوط به ساختار ترکیبی ب از شبکههای عصبی پرسپترون چند لایه
SVT |
RBBB |
PVC |
NOR |
LBBB |
|
2 |
0 |
1 |
0 |
17 |
LBBB |
2 |
0 |
0 |
16 |
2 |
NOR |
1 |
0 |
16 |
3 |
0 |
PVC |
2 |
18 |
0 |
0 |
0 |
RBBB |
17 |
0 |
0 |
0 |
3 |
SVT |
در بخش قبل مشخص شد که استفاده از ساختارهای ترکیبی قادر است صحت و دقت طبقهبندی را تا حد قابل ملاحظهای بالا ببرد. همچنین، با استفاده از این ساختار ترکیبی امکان استفاده از شبکههای عصبی با تعداد نرون کمتر فراهم میشود.همانگونه که اشاره شد، در اقدامی دیگر برای طبقهبندی کننده میانجی، از شبکه عصبی با توابع پایه شعاعی استفاده شده است. این شبکه عصبی یک ساختار پیشرو دارد و از لایههای با عملکردهای متفاوت تشکیل شده است.
لایه ورودی رابط بین دادههای ورودی و لایه میانی است. لایه مخفی میانی یک تبدیل غیرخطی از فضای لایه ورودی انجام میدهد. در بیشتر کاربردها فضای لایه میانی از بعد بالایی برخوردار است. لایه خروجی نیز رفتار خطی دارد و پاسخ شبکه را فراهم میکند [22]. جداول (9) و (10) بهترتیب پارامترهای ساختارهای ترکیبی الف و ب را در حالتی که برای طبقهبندی کننده میانجی از شبکه عصبی با توابع پایه شعاعی بهجای شبکه عصبی پرسترون چند لایه استفاده شده است، نشان میدهد.
شبکههای عصبی با توابع پایه شعاعی در مقایسه با سایر شبکههای استاندارد پیشرو با الگوریتم پسانتشار خطا، تعداد نرونهای بیشتری نیاز دارند، اما زمان مورد نیاز آنها برای آموزش در مقایسه با سایر شبکههای پیشروی دیگر کمتر است [22]. جداول کارایی ساختارهای الف و ب در این حالت و برای تمامی دادههای آموزشی بهترتیب بهصورت نشان داده شده در جداول (11) و (12) است.
جدول(9): پارامترهای شبکههای عصبی پرسپترون چندلایه (متخصص) و شبکه عصبی با توابع پایه شعاعی (میانجی) در ساختار الف
متخصص (N-P)(MLP) |
متخصص (R-S)(MLP) |
میانجی (RBF) |
پارامترها |
0.0045 |
0.0032 |
0.00043 |
میانگین متوسط مجذور خطا (MSE) در ده بار تکرار |
30 |
30 |
30 |
تعداد تکرار |
8 |
8 |
8 |
تعداد نرون ورودی |
10 |
10 |
73 |
تعداد نرون پنهان |
2 |
2 |
3 |
تعداد نرون خروجی |
جدول(10): پارامترهای شبکههای عصبی پرسپترون چندلایه (متخصص) و شبکه عصبی با توابع پایه شعاعی (میانجی) در ساختار ب
متخصص (N-P-S)(MLP) |
متخصص (L-R)(MLP) |
میانجی (RBF) |
پارامترها |
0.0039 |
0.0002 |
0.000071 |
میانگین متوسط مجذور خطا (MSE) در ده بار تکرار |
30 |
30 |
30 |
تعداد تکرار |
8 |
8 |
8 |
تعداد نرون ورودی |
10 |
10 |
80 |
تعداد نرون پنهان |
3 |
2 |
2 |
تعداد نرون خروجی |
جدول(11): جدول کارایی مربوط به ساختار ترکیبی الف از شبکههای عصبی پرسپترون چند لایه و شبکه عصبی با توابع پایه شعاعی
SVT |
RBBB |
PVC |
NOR |
LBBB |
|
0 |
0 |
0 |
1 |
19 |
LBBB |
0 |
0 |
1 |
18 |
1 |
NOR |
0 |
0 |
18 |
2 |
0 |
PVC |
1 |
19 |
0 |
0 |
0 |
RBBB |
19 |
1 |
0 |
0 |
0 |
SVT |
جدول(12): جدول کارایی مربوط به ساختار ترکیبی ب از شبکههای عصبی پرسپترون چند لایه و شبکه عصبی با توابع پایه شعاعی
SVT |
RBBB |
PVC |
NOR |
LBBB |
|
0 |
1 |
0 |
0 |
19 |
LBBB |
2 |
0 |
0 |
18 |
0 |
NOR |
1 |
0 |
16 |
0 |
3 |
PVC |
0 |
20 |
0 |
0 |
0 |
RBBB |
19 |
0 |
0 |
0 |
1 |
SVT |
صحت عملکرد این ساختارها بهترتیب 93% و 92% است. متوسط کارایی این ساختارهای ترکیبی برای دادههای آزمایشی در ده تکرار برای ساختار ترکیبی الف برابر 70% و برای ساختار ترکیبی ب برابر 80% بهدست میآید.
مقایسه نتایج نشان میدهد که مدلسازی فرآیند تشخیص بیماری و انتقال بار تصمیمگیری طبقهبندی کننده میانجی به طبقهبندی کنندههای تخصصی، در مواردی که ابهام در تصمیمگیری وجود دارد، صحت و دقت طبقهبندی را افزایش میدهد. این در حالی است که برای هر کدام از شبکههای عصبی موجود در ساختار ترکیبی پیچیدگیهای ساختاری و آموزشی کاهش مییابد. همچنین بالا رفتن متوسط نرخ بازشناسی دادههای آزمایشی در نتایج ساختار ترکیبی نشان دهنده قابلیت تعمیم بهتر این ساختار است.
مهمترین مسأله در تحقیقات پزشکی، استفاده از دادههای خام مناسب است. بدین معنی که این دادهها نه تنها باید به درستی ثبت شده باشند، بلکه باید توسط کاردیولوژیستهای متخصص و معتبری تشخیص و برچسبگذاری شده باشند. در این مقاله بهمنظور پیداکردن وقایع غیرنرمال قلبی و بهدستآوردن معتبرترین نتایج، از سیگنالهای الکتروکاردیوگرافی برچسب خورده معتبری در پایگاه دادههای MIT-BIH استفاده شده است.
همانگونه که اشاره شد، فرآیند پیشپردازش، گامی حیاتی پیش از مرحله استخراج ویژگیها و طبقهبندی الگوهاست.
در بخش قطعهبندی سیگنالهای پایه انتخاب بازههای مناسبی برای قطعات و اعمال فیتلرهای مناسبی برای کاهش نویز میتوان دقت مرحله استخراج ویژگی را تا حد قابل ملاحظهای افزایش داد.
در مرحله استخراج ویژگی، پانزده ویژگی موجک از سه سطح 5، 6 و7 سیگنالهای جزئیات استخراج و با پانزده ویژگی شناختی از مولفههای زمانی این سیگنالها با استفاده از روش تحلیل اجزای اصلی کاهش ابعاد مییابد.
استفاده از دیگر روش های ترکیب ویژگیها مانند LDA و GDA میتواند ساختارهای ترکیبی مناسبتر دیگری را تولید و در اختیار مرحله طبقهبندی قرار دهد.
در مرحله بعدی با استفاده از این ویژگیهای ترکیبی و نیز ترکیب نتایج طبقهبندی کنندهها، طبقهبندی نهایی انجام میشوند. طبقهبندی کنندههای که در این تحقیق استفاده شدهاند، شامل MLP، MIX-MLP و MIX-RBF-MLP هستند که از ساختارهای مختلفی پشتیبانی میکنند. وجه تمایز سیستم هوشمند طراحی شده در این تحقیق نسبت به دیگر کارهای انجام شده در این زمینه، در واقع به استفاده از سیستمهای ترکیبی شامل شبکههای میانجی و شبکههای متخصصی مربوط میشود که توان طبقهبندی بالایی را به نسبت طبقهبندیکنندههای معمولی در اختیار سیستم قرار میدهند. از طرفی، این طبقهبندیکننده ترکیبی نه تنها میزان دقت تشخیص سیستم را افزایش میدهد؛ بلکه پیچیدگیهای پارامتری دیگر طبقهبندیکنندهها را از جمله تعداد لایههای میانی سرعت همگرایی و غیره را تا حد قابل ملاحظهای بهبود میدهد. طبقهبندی در این روش پیشنهادی به دقت 93% با استفاده از سیستمهای ترکیبی دست یافته است.
سپاسگزاری
این تحقیق با حمایت و پشتیبانی گروه برق الکترونیک دانشکدهی مهندسی دانشگاه بیرجند و نیز همکاری بی شائبه خانم دکتر آیدا علیرضائی صورت گرفته است.