Recognition Covid-19 cases using deep type-2 fuzzy neural networks based on chest X-ray image

Document Type : Research Article

Authors

1 Department of Engineering Sciences, Faculty of Advanced Technologies, University of Mohaghegh Ardabili, Namin, Iran

2 Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran

3 Department of Mechanical Engineering, University of Tabriz, Tabriz, Iran, Iran

4 Department of Biomedical Engineering, Mamaghan Branch, Islamic Azad University, Mamaghan, Iran

Abstract

Today, the new coronavirus (Covid-19) has become a major global epidemic. Every day, a large proportion of the world's population is infected with the Covid-19 virus, and a significant proportion of those infected dies as a result of this virus. Because of the virus's infectious nature, prompt diagnosis, treatment, and quarantine are considered critical. In this paper, an automated method for detecting Covid-19 from chest X-ray images based on deep learning networks is presented. For the proposed deep learning network, a combination of convolutional neural networks with type-2 fuzzy activation function is used to deal with noise and uncertainty. In this study, Generative Adversarial Networks (GANs) were also used for data augmentation. Furthermore, the proposed network is resistant to Gaussian noise up to 10 dB. The final accuracy for the classification of the first scenario (healthy and Covid-19) and the second scenario (healthy, Pneumonia and Covid-19) is about 99% and 95%, respectively. In addition, the results of the proposed method in terms of accuracy, precision, sensitivity, and specificity in comparison with recent research are promising. For example, the proposed method for classifying the first scenario has 100% and 99% sensitivity and specificity, respectively. In the field of medical application, the proposed method can be used as a physician's assistant during patient treatment.

Keywords


  • مقدمه[1]

ویروس کرونای جدید1 در ووهان چین در دسامبر سال 2019 آغاز شد [1]. این ویروس امروزه بهداشت عمومی را در سراسر جهان با مشکل مواجه کرده است [2]. ویروس کرونای جدید با نام SARS-COV-2 نیز شناخته می‌شود. شواهدی وجود دارد که براساس آن محققان معتقدند این ویروس از خفاش‌ها و مورچه‌خوارها به انسان منتقل شده است [3]. تاکنون (بهمن 99) بیش از 100 میلیون نفر از جمعیت جهان به این ویروس مبتلا شده‌اند که از این تعداد، متأسفانه بیش از 2 میلیون نفر جان خود را بر اثر ابتلا به این بیماری از دست داده‌اند [4]. طبق یافته‌های محققان، این ویروس برخلاف مرگ‌ومیر کم، می‌تواند بسیار واگیردار باشد. تخمین زده شده است که هر فرد در صورت ابتلا به این ویروس، به‌طور متوسط می‌تواند 7 فرد دیگر را آلوده کند [5]. طبق تحقیقات اخیر، ابتلا به این ویروس در کودکان به‌دلیل داشتن سیستم ایمنی قوی بسیار خفیف است؛ در مقابل، این ویروس در افراد مسن و سیگاری بسیار پرخطر ظاهر می‌شود [5]. همچنین، شواهد دیگری وجود دارد که نشان می‌دهد شانس ابتلای افراد مذکر به این ویروس نسبت به افراد مؤنث بسیار بیشتر است [5]. از علائم ابتلا به ویروس کرونای جدید، سرفه، تب شدید، خستگی، سندروم حاد تنفسی2، شوک سپتیک3 و غیره است. این ویروس با هدف قراردادن سیستم تنفسی فرد، سبب ذات‌الریه می‌شود. عفونت ذات‌الریه در ریه، نفس‌کشیدن را برای بیمار دشوار می‌کند [6].

طبق آخرین توصیه‌های سازمان بهداشت جهانی4، از آزمون واکنش زنجیره‌ای پلیمراز ترانس‌کریپتاز معکوس (RT-PCR5) برای تشخیص قطعی آلودگی فرد به ویروس کرونای جدید استفاده می‌شود [6-7]. این آزمون از نمونه‌گیری بزاق دهان و بینی به دست می‌آید؛ با این حال، کیت‌های مربوط به تشخیص ویروس مبتنی بر این آزمون محدودند [8]. علاوه ‌بر این، این کیت‌ها زمان زیادی برای تشخیص نیاز دارند و نسبت به تشخیص ویروس حساسیت کمی دارند. همچنین این کیت‌ها با توجه به ماهیت تهاجمی که دارند، پزشکان و پرستاران را در معرض آلودگی به ویروس قرار می‌دهند [9]؛ درنهایت، گفتنی است تشخیص مبتنی بر این آزمون مقرون‌به‌صرفه نیست.

تصویربرداری قفسه سینه6 روش دیگری است که برای تشخیص این ویروس در طول مدت درمان بیمار استفاده می‌شود [10]. اسکن توموگرافی کامپیوتری7 (CT) و رادیوگرافی دیجیتال8 (DR) ازجمله روش‌های تصویربرداری قفسه سینه هستند [11، 12]. هرکدام از این روش‌ها برای تصویربرداری مزایا و معایبی دارند که در ادامه هریک را بررسی خواهیم کرد. از DR به‌منظور تشخیص شکستگی استخوان‌ها، ذات‌الریه، تومورها و بیماری‌های ریوی استفاده می‌شود [12]. در مقابل، CT یک رادیوگرافی پیشرفته است که تصاویر واضح‌تری از بافت‌ها، اندام‌ها و استخوان‌ها فراهم می‌کند [11]؛ با این حال، CT در تمامی مراکز درمانی موجود نیست و یک دستگاه تصویربرداری پرهزینه محسوب می‌شود [11]؛ در مقابل، RD تقریباً در تمامی مراکز درمانی موجود بوده و مقرون‌به‌صرفه‌تر است.

در تشخیص مبتنی بر RD، پزشک باید به‌صورت بصری براساس دانش و تجربة خود از روی تصاویر اشعه ایکس9 قفسه سینه، پنومونیای10 ویروسی، باکتریایی، کووید-19 و غیره را تشخیص دهد [13]. همان‌طور که ثابت شده است، تشخیص براساس دانش و تخصص پزشک به‌صورت بصری وقت‌گیر و مستعد خطا است و سبب دقت پایین در تشخیص نیز خواهد شد [14]؛ درنهایت، به سیستمی نیاز است تا بتواند به‌صورت خودکار پنومونیای باکتریایی، ویروسی، کووید-19 و غیره را از تصاویر ایکس بدون نیاز به تشخیص بصری تشخیص دهد. تشخیص خودکار کووید-19 از تصاویر ایکس علاوه بر تشخیص سریع، کاهش حجم کار پزشکان را سبب می‌شود و برای درمان به‌موقع و کاهش مرگ‌ومیر بیماران امری ضروری تلقی می‌شود. به‌تازگی تحقیقات بسیاری در زمینة تشخیص خودکار کووید-19 با استفاده از تصاویر X-Ray قفسه سینه ارائه شده است که در ادامه هریک از این پژوهش‌ها را بررسی خواهیم کرد.

نارین و همکاران [15] از تصاویر اشعه ایکس قفسه سینه برای تشخیص خودکار پنومونیا براساس سه شبکة یادگیری عمیق از پیش آموزش دیده11 شامل Inception V3، ResNet 50 و Inception-ResNet V2 استفاده کردند. مدل ResNet 50 در میان سایر شبکه‌های ارائه‌شده توسط این پژوهشگران، بهترین عملکرد را داشته است. صحت گزارش‌شده برای طبقه‌بندی 2 کلاسه (سالم و کووید-19) براساس الگوریتم پیشنهادی آنها، حدود 98 درصد بوده است. پابیرا و همکاران [16] از شبکه‌های یادگیری عمیق برای تشخیص خودکار بیماری‌های MERS ، SARS و کووید-19 با استفاده از تصاویر اشعه ایکس قفسه سینه استفاده کردند. آنها از ResNet 50 به همراه ماشین بردار پشتیبان12 (SVM) در مدل پیشنهادی خود استفاده کردند و به صحت 95 درصد در طبقه‌بندی این بیماری‌ها از یکدیگر دست یافتند. چوچان و همکاران [17] از تصاویر اشعه ایکس قفسه سینه برای تشخیص خودکار پنومونیا استفاده کردند. محققان در مدل پیشنهادی خود از پنج شبکة از پیش آموزش دیدة عمیق شامل AlexNet ، DenseNet، Inception V3 ، ResNet 18 و GoogLeNet استفاده کردند. صحت نهایی گزارش‌شده توسط این محققان برای طبقه‌بندی پنومونیای 2 کلاسه 96 درصد بود. خلیفه و همکاران [18] از ترکیب شبکه‌های مولد تخاصمی13 (GANs) با شبکه‌های از پیش آموزش دیدة عمیق برای تشخیص خودکار پنومونیا از تصاویر اشعه ایکس قفسه سینه استفاده کردند؛ ازجمله شبکه‌های استفاده‌شده در مدل پیشنهادی این پژوهشگران، AlexNet، GoogLeNet، SqueezNet و ResNet18 بود. صحت گزارش‌شده توسط این محققان برای طبقه‌بندی پنومونیا در 2 کلاس مختلف تقریباً 99 درصد گزارش شده است. استفان و همکاران [19] یک مدل کارآمد یادگیری عمیق را برای طبقه‌بندی پنومونیا از تصاویر اشعه ایکس قفسه سینه ارائه داده‌اند. معماری شبکة آنها از 4 لایه کانولوشن14 و 2 لایه تماماً متصل15 تشکیل شده بود. محققان در طبقه‌بندی دو کلاس سالم و پنومونیا به صحت 7/93 درصد دست یافتند. لونیس و همکاران [20] از 1427 تصویر اشعه ایکس قفسه سینه برای طبقه‌بندی خودکار سه نوع پنومونیا (ویروسی، باکتریایی و کووید-19) استفاده کرده‌اند. آنها پنج شبکة از پیش آموزش دیدة عمیق شامل VGG ، MobileNet V2 ، Inception،Xception ، ResNet V2) را در الگوریتم پیشنهادی خود به کار گرفتند. تحقیقات آنها نشان می‌دهد شبکة VGG عملکرد بهتری نسبت به سایر شبکه‌ها داشته است. صحت نهایی برای طبقه‌بندی 2 کلاس (سالم و کووید-19) و 3 کلاس (ویروسی، باکتریایی و کووید-19) به‌ترتیب 75/98 درصد و 48/93 درصد گزارش شده است. هوآویانگ و همکاران [21] از شبکه‌های عصبی عمیق16 در ترکیب با جنگل تصادفی17 برای طبقه‌بندی خودکار پنومونیای 2 کلاسه استفاده کردند. همچنین، این پژوهشگران از یک فیلتر میانی برای از بین بردن نویز تصاویر اشعه ایکس قفسه سینه استفاده کردند. دقت نهایی گزارش‌شده توسط این محققان برای طبقه‌بندی پنومونیا در 2 کلاس مختلف، 97 درصد گزارش شده است. هینتون و همکاران [22] از 3 نوع روش تصویربرداری پزشکی (اشعه ایکس، سونوگرافی18 و CT) برای تشخیص خودکار کلاس‌های کووید-19 و سالم از یکدیگر استفاده کردند. این پژوهشگران در تحقیقات خود از شبکة از پیش آموزش دیدة VGG با تغییراتی در معماری این شبکه استفاده کردند. صحت طبقه‌بندی روش پیشنهادی آنها برای سه حالت تصویربرداری مختلف (اشعه ایکس، CT و سونوگرافی) به‌ترتیب 86، 84 و 100 درصد گزارش شده است. اردکانی و همکاران [23] از شبکه‌های یادگیری عمیق با استفاده از تصاویر CT برای تشخیص دو کلاس کووید-19 و سالم استفاده کردند. آنها از 10 شبکة از پیش آموزش دیدة عمیق ازجمله ResNet-50، VGG-16، SqueezeNet، ResNet-101، MobileNet-V2، AlexNet، VGG-19، Xception، ResNet-18 و GoogLeNet استفاده کردند و براساس شبکة Xception به نتایج امیدوارکننده‌ای دست یافتند. صحت نهایی گزارش‌شدۀ این محققان براساس شبکة Xception حدود 99 درصد است.

همان‌طور که مشهود است بیشتر مطالعات قبلی در روش پیشنهادی خود از شبکه‌های از پیش آموزش دیدة عمیق استفاده کرده‌اند و به نتایج درخور توجهی دست‌ یافته‌اند؛ با این حال، این شبکه‌ها بیشتر برای استفاده در داده‌هایی با مقیاس کوچک مناسب‌اند. همچنین، بعضی از مطالعات پیشین صرفاً به ارزیابی الگوریتم خود در طبقه‌بندی دو کلاسه بسنده کرده‌اند و کلاس‌های چالش‌برانگیز را در روش پیشنهادی خود به کار نگرفتند. برای ورود پژوهش حاضر به حوزة کاربردی و عملی لازم است معماری شبکة پیشنهادی به گونه‌ای طراحی شود که نخست بتواند برای داده‌های با مقیاس بزرگ‌تر استفاده شود؛ دوم، انواع کلاس‌ها و سناریوهای مهم و کاربردی در آن در نظر گرفته شود. در این مطالعه از ترکیب شبکه‌های یادگیری عمیق با توابع فعال‌ساز فازی نوع دو19 به همراه شبکه‌های GAN برای تشخیص انواع پنومونیا در 3 کلاس (سالم، پنومونیا و کووید-19) و 2 سناریوی مهم کاربردی استفاده شده است. همچنین، شبکة پیشنهادی را می‌توان یک طبقه‌بندی‌کنندة پایان به پایان در نظر گرفت که در آن نیازی به فرایند انتخاب / استخراج ویژگی‌های مطلوب نیست و ویژگی‌های لازم و مورد نیاز هر کلاس به‌طور خودکار توسط شبکة عمیق پیشنهادی فرا آموخته می‌شود.

ادامة مقاله به‌صورت زیر تدوین شده است: بخش 2 پایگاه دادة استفاده‌شده را توصیف می‌کند؛ همچنین، شبکه‌های عصبی کانولوشنال به همراه شبکه‌های فازی نوع 2 در این بخش توضیح داده می‌شوند. در بخش 3، معماری شبکة پیشنهادی براساس ترکیب با تابع فازی نوع 2 ارائه می‌شود. در بخش 4، نتایج شبیه‌سازی بررسی می‌شوند. درنهایت، بخش 5 مربوط به نتیجه‌گیری است.

 

2- مواد و روش‌ها

در این بخش ابتدا مجموعه داده‌های استفاده‌شده در این پژوهش توضیح داده می‌شود. سپس شبکه‌های GAN شرح داده خواهد شد. همچنین، شبکه‌های عصبی عمیق به همراه شبکه‌های فازی نوع 2 در این بخش بررسی خواهند شد.

 

  • پایگاه داده

در این پژوهش محققان برای ارزیابی روش پیشنهادی خود از پایگاه دادة رادیوگرافی کووید-19 [24] استفاده کرده‌اند. این پایگاه داد به‌تازگی به‌صورت گسترده در مطالعات پیشین استفاده شده است. محققان کشورهای قطر، دوحه، پاکستان و مالزی، پایگاه دادة استفاده‌شده را ایجاد کرده‌اند که شامل تصاویر رادیوگرافی قفسه سینه در 3 کلاس مختلف سالم، پنومونیا (ویروسی و باکترایی) و کووید-19 است. تعداد تصاویر رادیوگرافی قفسه سینه برای هریک از کلاس‌های سالم، پنومونیا و کووید-19 به‌ترتیب 1341، 1345 و 202 است. شکل 1 نمونه‌ای از تصاویر رادیوگرافی قفسه سینه برای 3 کلاس سالم، پنومونیا و کووید-19 را نشان می‌دهد. همان‌طور که در شکل 1 مشخص است، هیچ تفاوت محسوسی بین کلاس‌های کووید-19 و پنومونیا مشاهده نمی‌شود.

 

 

شکل (1): تصاویر رادیوگرافی قفسه سینه مربوط به کلاس‌های سالم، پنومونیا و کووید-19 (از چپ به راست).

  • شبکه‌های مولد تخاصمی (GAN)

گودفلو و همکاران در سال 2014 برای نخستین‌بار شبکه‌های GAN را معرفی کردند [25]. در سال‌های اخیر، این شبکه‌ها شایان توجه بسیاری از محققان در حوزة یادگیری عمیق قرار گرفته‌اند. GANها با استفاده از معماری شبکة عصبی کانولوشن می‌توانند مجموعه داده‌های (مانند تصاویر اشعه ایکس قفسه سینه) استفاده‌شده در آزمایش‌ها را یاد بگیرند و یک مجموعه دادة جدید و واقعی ایجاد کنند که در مجموعه دادة قبلی موجود نیست. ازجمله کاربردهای این شبکه در حوزة بینایی ماشین، می‌توان به تولید محتوای ویدئویی، استخراج ویژگی به‌صورت یادگیری بدون نظارت، کدگذاری تصویر و تصویربرداری با وضوح فوق‌العاده، تجزیه و تحلیل و سنتز گفتار اشاره کرد [25].

این شبکه‌ها براساس رویکرد تئوری بازی‌ها بناگذاری شده‌اند که در آن یک شبکة یادگیری عمیق که مولد20 (G) نامیده می‌شود، با یک روند تخاصمی رقابت می‌کند. شبکة عمیق دیگری که متمایزکننده21 (D) نامیده می‌شود، سعی می‌کند نمونه‌های تولیدشده از شبکة مولد را از داده‌های اصلی متمایز کند. رقابت بین این دو شبکه درنهایت باعث یادگیری بهتر و بهبود عملکرد هر دو می‌شود. شبکة G وظیفه دارد تصاویر را تا حد ممکن طبیعی و واقعی تولید کند. برای یادگیری توزیع شبکة G روی‌ داده‌های ورودی، ابتدا از یک توزیع نویز به‌عنوان ورودی استفاده می‌شود. شبکة D وظیفة تشخیص تصاویر از تصاویر مصنوعی را بر عهده دارد؛ برای مثال، در مطالعة حاضر شبکة D باید به تصاویر اشعه ایکس قفسه سینه تولیدشده توسط شبکة G نگاه کند تا تعیین کند آیا این تصاویر به اندازه کافی طبیعی هستند یا خیر. شبکة D به‌منظور به حداکثر رساندن دقت تشخیص داده‌های اصلی از داده‌های تولیدشده آموزش داده می‌شود. همچنین، شبکة G به‌طور هم‌زمان آموزش داده شده است تا شبکة D را گمراه کند که تابع زیر را به حداقل برساند:

(1)

 

 

درنهایت، تابع زیر به حداقل می‌رسد:

(2)

 

 

با توجه به معادلة بالا، D به گونه‌ای استخراج می‌شود که بتواند داده‌های واقعی و مصنوعی را به‌درستی تشخیص دهد [26]. رابطه (2) به‌صورت فرم بسته قابل حل نیست و بنابراین از روش‌های تکراری و عددی به‌منظور حل آن استفاده می‌شود. بهینه‌سازی D در حلقه داخلی آموزش، پیچیدگی محاسباتی بالایی دارد و برای داده‌های با تعداد نمونة کم، باعث پدیدة بیش‌برازش خواهد شد؛ بنابراین، به‌ازای هر k بار بهینه‌سازی تابع D، یک بار تابع G بهینه می‌شود. به‌ازای هر تکرار k، به تعداد m از فضای نویز اولیه نمونه‌برداری شده است و به تعداد m از توزیع اولیه داده‌ها Pdata نمونه‌برداری می‌شود .

 

  • شبکه‌های عصبی کانولوشن

شبکة عصبی کانولوشنال، درواقع یک شبکة عصبی بهبودیافته است. در این شبکه، چندین لایه با روشی قدرتمند در کنار هم آموزش می‌بینند [27]. این روش، بسیار کارآمد بوده و یکی از رایج‌ترین روش‌ها در کاربردهای مختلف بینایی ماشین است. همانند ANN، تصمیم خروجی نهایی مدل CNN براساس وزن و بایاس لایه‌های قبلی در ساختار شبکه است.

در هر شبکة عصبی کانولوشنال، دو مرحله برای آموزش وجود دارد؛ مرحله انتشار پیشرو22 و مرحله پس‌انتشار23 (BP) [27] BP .روشی برای محاسبة گرادیان تابع اتلاف نسبت به وزن‌ها است. BP سیگنال‌های خطا را در شبکه حین آموزش به عقب انتشار می‌دهد و باعث به‌روزرسانی وزن‌ها می‌شود. در مرحله اول، داده‌های ورودی به شبکه اعمال می‌شوند و این عمل چیزی بجز ضرب نقطه‌ای بین ورودی و پارامترهای هر نورون و سپس اعمال عملیات کانولوشن در هر لایه نیست و درنهایت، خروجی شبکه محاسبه می‌شود. به‌منظور تنظیم پارامترهای شبکه یا به عبارت دیگر آموزش شبکه، از نتیجة خروجی برای محاسبة میزان خطای شبکه استفاده می‌شود. برای این کار، خروجی شبکه با استفاده از یک تابع خطا24 با پاسخ صحیح، مقایسه و به این ترتیب، میزان خطا محاسبه می‌شود. در مرحله بعد، براساس میزان خطای محاسبه‌شده، مرحله پس‌انتشار آغاز می‌شود. در این مرحله، گرادیان هر پارامتر با توجه به قاعدة زنجیره‌ای محاسبه شده و تمامی پارامترها با توجه به تأثیرشان بر خطای ایجادشده در شبکه، به‌روزرسانی می‌شوند. بعد از به‌روزرسانی پارامترها، مرحله بعدی انتشار پیشرو آغاز خواهد شد. بعد از تکرار تعداد مناسبی از این مراحل، آموزش شبکه به پایان می‌رسد. در این شبکه، خروجی هر لایه همان ویژگی‌ها هستند که بعد کمتری نسبت به دادة اصلی دارند [27، 28].

به‌طور کلی، یک شبکة کانولوشنال از سه لایه اصلی تشکیل می‌شود که عبارت‌اند از لایة کانولوشن، لایة ادغام25 و لایة تمام متصل26 (FC) [29]. برای جلوگیری از فرایند بیش‌برازش27‌‌ و بهبود عملکرد شبکه می‌توان از لایه‌های حذف تصادفی28 و نرمال‌سازی دسته‌ای29 نیز استفاده کرد. همچنین در شبکه‌های عصبی نیاز است پس از هر لایه از تابع فعال‌سازی‌‌ استفاده شود که در ادامه، این لایه‌ها و توابع به‌طور خلاصه معرفی می‌شوند.

لایة کانولوشن: شامل فیلترهایی (کرنل‌هایی) است که روی سیگنال EEG می‌لغزند. یک کرنل، یک ماتریس است که با سیگنال ورودی EEG کانوالو می‌شود. این لایه عمل کانولوشن را روی سیگنال EEG ورودی با استفاده از کرنل انجام می‌دهد. خروجی کانولوشن را نگاشت ویژگی می‌نامند. عملگر کانولوشن به شرح زیر است:

(3)

 

 

که x سیگنال، h فیلتر، N تعداد عناصر در x و y بردار خروجی است.

لایة ادغام: این لایه که به کاهش نمونه30 نیز معروف است، ابعاد نورون‌های خروجی از لایة کانولوشن را کاهش می‌دهد و باعث کاهش محاسبات و همچنین جلوگیری از پدیدة بیش‌برازش می‌شود. در این پژوهش از لایة ادغام بیشینه31 استفاده شده است که فقط مقادیر بیشینه در هر نگاشت ویژگی را انتخاب می‌کند و باعث کاهش تعداد نورون‌های خروجی می‌شود.

لایة FC: دارای اتصال کامل به تمام فعال‌سازی‌ها در لایة قبلی است.

لایة حذف تصادفی: از این لایه به‌منظور جلوگیری از پدیدة بیش‌برازش استفاده می‌شود. نحوة کار آن به این صورت است که در هر مرحله از آموزش، هر نورون با احتمالی از شبکه بیرون انداخته شده است؛ به طوری که درنهایت یک شبکة کاهش داده شده باقی می‌ماند.

لایة نرمال‌سازی دسته‌ای: این لایه به‌منظور نرمال‌سازی داده‌ها در داخل شبکه انجام می‌شود [29]. زمانی که محاسبات مختلف روی ‌دادة ورودی اعمال ‌شود، توزیع داده‌ها تغییر خواهد کرد. این لایه با هدف کاهش تغییر کوواریانس داخلی، سرعت آموزش شبکه را افزایش می‌دهد و باعث تسریع در همگرایی می‌شود. تبدیل لایة نرمال‌سازی دسته‌ای به شرح زیر است:

(4)

 

 

که  و به‌ترتیب میانگین و واریانس دسته‌اند.  یک ثابت کوچک برای ثبات عددی، شماره لایه،  بردار ورودی به لایة نرمال‌ساز، بردار خروجی نرمال مربوط به یک نورون است، و به‌ترتیب پارامترهای مربوط به مقیاس و تغییر نرخ یادگیری‌اند.

تابع فعال‌سازی: پس از هر لایة کانولوشن، یک تابع فعال‌سازی اعمال می‌شود. تابع فعال‌سازی یک عملگر است که خروجی را به مجموعه‌ای از ورودی‌ها نگاشت می‌کند و برای غیرخطی‌کردن ساختار شبکه استفاده می‌شود. رابطه‌های 5 و 6 توابع فعال‌سازی LeakyRelu و Relu را نشان می‌دهند. مطابق با رابطه 5، در حالت نرمال  است.

(5)

 

(6)

 

 

تابع سافت‌مکس32: این تابع توزیع احتمالی کلاس‌های خروجی را محاسبه می‌کند؛ بنابراین، در لایة تمام متصل آخر از تابع سافت‌مکس برای پیش‌بینی اینکه کدام سیگنال ورودی به هیجان مثبت، منفی و خنثی مربوط است، استفاده می‌شود و رابطة آن به فرم زیر است:

(7)

 

 

که در آن، x ورودی شبکه است و مقادیر خروجی p بین صفر و یک بوده که مجموع آنها برابر با یک است.

 

  • مجموعه‌های فازی نوع 2 (T2F sets)

پروفسورزاده در سال 1975 مجموعه‌های فازی نوع 2 را به‌عنوان توسعه‌ای از مجموعه‌های فازی نوع 1 معرفـی کـرد [30]. برخلاف سیستم‌های فازی نوع 1، توابع تعلق در سیستم‌های فازی نوع 2 دارای درجه عضویت‌های فازی‌اند. استفاده از توابع تعلق فازی نوع 2 توانایی سیستم‌های فازی را در مواجهه با عدم قطعیت‌ها (ساختاری و نویز اندازه‌گیری) و در مقایسه با سیستم‌های فازی معمولی (توابع فازی نوع 1) تا حد چشمگیری افزایش داده است.

  در پژوهش‌های انجام‌شده، از این توانایی سیستم‌های فازی نوع 2 در طراحی سیستم‌های کنترل، پیش‌بینی سری‌های زمانی و محاسبه با کلمات استفاده شده است که عدم قطعیت و پیچیدگی زیاد دارند و کارایی آنها در کابردهای تئوری و عملی نشان داده شده است. در این میان، یکی از مهم‌ترین اجزای DNN عملکرد توابع فعال‌سازی‌ها است؛ زیرا توابع فعال‌سازی در فرایند یادگیری نقش مهمی دارند. پس از کشف تابع Relu که امروزه به‌عنوان پرکاربردترین واحد فعال‌سازی به شمار می‌رود، DNNها پیشرفت زیادی کرده‌اند؛ زیرا Relu علاوه بر کاهش مشکل حذف گرادیان، عملکرد یادگیری را نیز بهبود می‌بخشد. توابع مختلف فعال‌سازی مشابه Relu و Leaky-Relu برای بهبود بیشتر عملکرد یادگیری در شبکه‌های DNN ارائه شده است. با این حال، حتی اگر این توابع فعال‌سازی عملکرد خوبی در DNNها داشته باشند، روابط ورودی و خروجی بین آنها غیرخطی است که یک نقطه ضعف مشترک در همه این توابع فعال‌سازی‌ها محسوب می‌شود [31].

با توجه به توانایی یادشده مجموعه‌های فازی نوع 2، در این پژوهش از توابع تعلق فعال‌ساز فازی نوع 2 به‌جای توابع فعال‌سازی Relu و Leaky-Relu در لایه‌های میانی معماری FCNN پیشنهادی استفاده شده است. بر همین اساس، نسبت توابع آن در شبکة FCNN پیشنهادی به‌صورت زیر تعریف می‌شود:

(8)

 

 

که در آن تابع k به‌صورت زیر بیان می‌شود [31]:

(9)

 

 

اگر مشتقات ریاضی مورد نیاز را دربارة پارامترهای معرفی‌شده در بالا ارائه دهیم، این پارامترها می‌توانند به‌عنوان پارامترهای یادگیری استفاده شوند. به بیان دیگر، پارامترهای باید در هر تکرار به‌روزرسانی شوند که الگوریتم به‌روزرسانی آنها به شکل معادلات زیر است:

(10)

 

 

که c نشان‌دهندة لایه‌ها، j مربوط به المان مشاهدات و L نشان‌دهندة تابع هدف DNN است. همچنین،  نشان‌دهندة شیب انتشاریافته از لایه‌های عمیق‌تر پس از لایة فعال‌ساز فازی نوع 2 است و شیب کلی آن برابر است با:

(11)

 

 

و همچنین:

(12)

 

 

که در معادله بالا، از قانون به‌روز‌رسانی پارامترها به فرم زیر حاصل می‌شود:

(13)

 

 

که در آن، پارامترهای و به‌ترتیب نشان‌دهندة مقدار حرکت و نرخ آموزش‌اند [30-32].

 باتوجه به اینکه تعداد کل پارامترهای قابل یادگیری / تنظیم در استفاده از تابع فعال‌ساز فازی نوع 2 فقط است (C تعداد واحدهای پنهان)، در مقایسه با تعداد کل وزن‌های DNN معمولی، عدد نسبتاً کمی است؛ بنابراین، با توجه به مزایای مطرح‌شده در استفاده از تابع فعال‌ساز فازی نوع 2، در این پژوهش و در روش پیشنهادی از ترکیب شبکه‌های CNN و این توابع، به‌منظور مقابله با عدم قطعیت‌ها و نویز اندازه‌گیری استفاده شده است.

 

3- روش پیشنهادی

در این بخش، روش پیشنهادی در این مقاله ارائه می‌شود. شکل 2 ساختار کلی روش پیشنهادی را نشان می‌دهد. مطابق با شکل 2 همان‌طور که مشخص است در ابتدا عملیات پیش‌پردازش داده‌ها شامل عملیات نرمال‌سازی، سگمنت‌بندی و افزایش دادگان روی تصاویر انجام می‌گیرد. سپس عملیات انتخاب و استخراج ویژگی به‌منظور طبقه‌بندی کلاس‌ها روی دادگان انجام خواهد شد. در ادامه هریک از این مراحل به‌صورت کامل شرح داده می‌شوند.

 

 

3-1- پیش‌پردازش داده‌ها

در این بخش، پیش‌پردازش‌های انجام‌شده روی دادگان بررسی می‌شوند. مطابق با الگوریتم پیشنهادی، عملیات پیش‌پردازش روی داده‌ها شامل چهار مرحله زیر است:

ابتدا تمامی تصاویر بین (0 و 1) نرمالیزه می‌شوند. سپس در مرحله دوم اندازه تصاویر به 224×224 تغییر داده می‌شود. تغییر اندازه تصاویر به‌منظور تسهیل در روند آموزش و کاهش زمان محاسباتی انجام می‌پذیرد. در مرحله سوم با توجه به یکسان‌نبودن تعداد نمونه‌های مربوط به هر کلاس سالم، پنومونیا و کووید-19، از شبکه‌های GAN برای افزایش تعداد نمونه‌های کووید-19 به‌منظور برقراری توازن بین کلاس‌ها استفاده می‌شود. استفاده از این شبکه‌ها سبب عدم بروز مشکل بیش‌برازش در طول آموزش روش پیشنهادی نیز خواهد شد. شبکة GAN بردار تصادفی صدتایی با توزیع یکنواخت را به‌عنوان ورودی می‌گیرد و سیگنالی به اندازه (224×224)=50176 را به‌عنوان خروجی تولید می‌کند. معماری این شبکه از چهار لایة متراکم کاملاً متصل (256، 512، 1024 و 50176) تشکیل ‌شده است که هر لایه با یک تابع نرمال‌ساز دسته‌ای به یکدیگر متصل است. برای شبکه‌های GAN، ما از تابع فعال‌سازی Leaky-Relu و تابع فعال‌سازی tanh به‌ترتیب در لایه‌های مخفی و انتهای شبکه استفاده کرده‌ایم. شبکة D ورودی 50176 را دریافت می‌کند و یک تصمیم (واقعی یا جعلی بودن تصاویر) را صادر می‌کند. شبکة D از چهار لایة متراکم کاملاً متصل (1024، 512، 256 و 1) به همراه یک لایة حذف تصادفی در هر لایه تشکیل شده است. در این شبکه از تابع Leaky-Relu به‌عنوان تابع فعال‌سازی در لایه‌های مخفی و از تابع سیگمویید در انتهای شبکه استفاده شده است. فرایند آموزش شبکه توسط تابع هزینه خطای میانگین مربعات33 (MSE) و بهینه‌ساز آنتروپی باینری34 با نرخ یادگیری 0002/0 و اندازه دسته 10 برای 1000 تکرار انجام شده است. شکل 3 تصاویر مصنوعی تولیدشده توسط شبکه‌های GAN برای کلاس کووید-19 را نشان می‌دهد. همچنین، جدول 1 تعداد نمونه‌های مربوط به هر کلاس را قبل و بعد از داده‌افزایی با استفاده از شبکه‌های GAN نمایش می‌دهد. در مرحله چهارم تمامی تصاویر به فرمت RGB تبدیل می‌شوند که پس از تبدیل، اندازه تصاویر به 224×224×3 تغییر می‌کند.

 

 

 

شکل (2): بلوک دیاگرام کلی روش پیشنهادی شامل بخش‌های پیش‌پردازش، افزایش دادگان و شبکة‌ عمیق پیشنهادی (بخش پیش‌پردازش دادگان شامل تغییر اندازه و نرمال‌سازی تصاویر، بخش افزایش دادگان براساس شبکه‌های مولد تخاصمی و بخش شبکة عمیق پیشنهادی براساس شبکه‌های تمام کانولوشنی با تابع فعال‌ساز فازی نوع 2).

 

شکل (3): تصاویر مصنوعی تولیدشده برای کلاس کووید-19.

 

جدول (1): تعداد نمونه‌های مربوط به هر کلاس

کووید-19

پنومونیا

سالم

گروه‌ها

202

1345

1341

قبل از استفاده از GAN

1200

-

-

بعد از استفاده از GAN

1402

1345

1341

مجموع

 

3-2- معماری شبکة عمیق پیشنهادی

در معماری شبکة پیشنهادی از ترکیب 7 لایة کانولوشن دو‌بعدی استفاده شده است. برای پیاده‌سازی شبکة پیشنهادی FCNN از کتابخانه کراس در زبان برنامه‌نویسی پایتون استفاده شده است. معماری شبکة عصبی عمیق پیشنهادی به‌صورت زیر انتخاب‌ شده است: 1)یک لایة حذف تصادفی؛ 2) یک ‌لایة کانولوشن با تابع فعال‌سازی فازی نوع 2 و یک لایة ادغام بیشینه همراه با نرمال‌ساز دسته‌ای اضافه می‌شود؛ 3) معماری مرحله قبل، 6 بار دیگر تکرار می‌شود؛ 4) خروجی معماری قبلی به یک ماتریس دوبعدی Flatten متصل می‌شود؛ 5) برای دسترسی به لایة خروجی از یک لایة سافت‌مکس استفاده می‌شود. شکل 4 جزئیات معماری شبکة عمیق پیشنهادی را نشان می‌دهد. جدول 2 جزئیات معماری شبکة پیشنهادی استفاده‌شده را نشان می‌دهد. طبق جدول 2 کاهش بعد در لایه‌های پنهان از 224×224×3 به 3 ادامه یافته است.

سه عامل اصلی بر شبکة پیشنهادی تأثیر می‌گذارد: 1) استفاده از توابع فعال‌سازی فازی به‌جای توابع فعال‌سازی Relu و Leaky-Relu. 2) استفاده از فیلتر بزرگ در لایة اول که سبب حذف نویزهای در محدوده فرکانس بالا می‌شود. 3) استفاده از فیلترهای کوچک در لایه‌های میانی که روند آموزش شبکه را تسهیل می‌کنند.

 

3-3- مجموعه آموزش، ارزیابی و آزمون

در این تحقیق تمامی ابرپارامترها مربوط به شبکة پیشنهادی به دقت تنظیم شده است تا بهترین میزان همگرایی حاصل شود. همچنین، از روش آزمون و خطا برای تعیین این ابرپارامترها در این پژوهش استفاده شده است؛ درنهایت، فرایند آموزش شبکه براساس تابع هزینة MSE و بهینه‌ساز  Rmsprop با میزان یادگیری و اندازه دسته 10 انجام شده است. تعداد کل پارامترها و نمونه‌ها برای هر سناریو به‌ترتیب 923327 و 4031 است. از کل نمونه‌های موجود (4031 نمونه)، 2015 نمونه برای مجموعه آموزشی (50 درصد)، 403 نمونه به‌منظور مجموعه اعتبارسنجی (10 درصد) و 1613 نمونه برای مجموعه آزمون (40 درصد) استفاده شده است. گفتنی است تمام نمونه‌های اختصاص داده شده به مجموعه‌های آموزش، ارزیابی و آزمون به‌طور تصادفی انتخاب شده‌اند.

در این پژوهش، به‌منظور طراحی مطلوب معماری پیشنهادی، از انواع مختلف بهینه‌سازها، تعداد مختلف لایه‌ها، تعداد و اندازه مختلف فیلترها و غیره استفاده شده است و پس از آزمون و خطا، معماری نهایی شبکه به دست آمده است. جدول 3 فیلترها و ابرپارامترهای بهینة انتخاب‌شده را نشان می‌دهد.

 

 

 

 

 

جدول (2): جزئیات معماری مربوط به شبکة عمیق پیشنهادی.

padding

Number of filters

Strides

Size of filter and Pooling

Output Shape

Activation function

Layer type

L

yes

16

1

128×128

(None, 16, 224,224)

Fuzzy

Convolution2-D

0-1

no

-

2

2×2

(None, 16, 112,112)

-

Max-Pooling2-D

1-2

yes

32

1

3×3

(None, 32,112,112)

Fuzzy

Convolution2-D

2-3

no

-

2

2×2

(None, 32, 56, 56)

-

Max-Pooling2-D

3-4

yes

64

1

3×3

(None, 64, 56, 56)

Fuzzy

Convolution2-D

4-5

no

-

2

2×2

(None, 64, 28, 28)

-

Max-Pooling2-D

5-6

yes

64

1

3×3

(None, 64, 28, 28)

Fuzzy

Convolution2-D

6-7

no

-

2

2×2

(None, 64, 14, 14)

-

Max-Pooling2-D

7-8

yes

64

1

3×3

(None, 64, 14, 14)

Fuzzy

Convolution2-D

8-9

no

-

2

2×2

(None, 64, 7, 7)

-

Max-Pooling2-D

9-10

yes

64

1

3×3

(None, 64, 7, 7)

Fuzzy

Convolution2-D

10-11

no

-

2

2×2

(None, 64, 3, 3)

-

Max-Pooling2-D

11-12

yes

3

1

3×3

(None, 3, 3, 3)

Fuzzy

Convolution2-D

10-11

no

-

2

2×2

(None, 3, 1, 1)

-

Max-Pooling2-D

11-12

-

-

-

-

(None, 3)

-

Flatten

13-14

-

-

-

-

(None, 3)

-

Softmax

14-15

 

جدول (3): پارامترهای بهینة انتخاب‌شده در شبکة پیشنهادی

Parameter

Search space

Optimal value

Optimizer

RMSProp, Adam, Sgd, Adamax, Adadelta

RMSProp

Cost function

MSE, MAE, Cross-entropy

MSE

Number of Convolution layers

3, 5, 7, 10,15

7

Number of Filters in the first convolution layer

16, 32, 64, 128

16

Number of Filters in the second convolution layer

16, 32, 64, 128

32

Number of Filters in the third convolution layer

16, 32, 64, 128

64

Number of Filters in the fourth convolution layer

16, 32, 64, 128

64

Number of Filters in the fifth convolution layer

16, 32, 64, 128

64

Number of Filters in the SIXTH convolution layer

16, 32, 64, 128

64

Size of filter in the first convolution layer

(3,3), (16,16), (32,32), (64,64), (128,128)

(128,128)

Size of filter in another convolution layers

(3,3), (16,16), (32,32), (64,64), (128,128)

(3, 3)

Dropout rate

0, 0.2, 0.3, 0.4, 0.5

0.3

Batch size

4, 8, 10, 16, 32, 64

10

learning rate

0.01, 0.001,0.0001

0.0001

 

 

4- نتایج و بحث

در این بخش نتایج مربوط به روش پیشنهادی ارائه شده‌اند. کلیه آزمایش‌های مربوطه روی سیستم کلاب35 گوگل انجام شده است که مشخصات آن به شرح زیر است: رم 25 گیگابایت و Tesla k90 GPU. در این پژوهش از معیارهای صحت، دقت، حساسیت و اختصاصیت به‌منظور ارزیابی مدل پیشنهادی استفاده شده است. فرمول محاسبة مربوط به این معیارها در روابط (14-17) ارائه شده است.

 

 

(14)

 

(15)

 

(16)

 

(17)

 

 

مطابق با روابط بالا، TP مثبت حقیقی، TN منفی حقیقی، FP مثبت کاذب و FN منفی کاذب نمونه‌ها در کلاس‌های طبقه‌بندی است.

شکل 5 صحت و خطای طبقه‌بندی را برای جداسازی 2 کلاس سالم و کووید-19 (سناریوی اول) و 3 کلاس سالم، پنومونیا و کویید-19 (سناریوی دوم) برای داده‌های آموزشی و ارزیابی در 100 تکرار نشان می‌دهد. همان‌طور که از شکل 5 مشخص است، درصد صحت طبقه‌بندی برای سناریوهای اول و دوم به‌ترتیب در تکرارهای 50 و 80 به حالت پایدار خود رسیده است. مطابق با شکل 5، همان‌طور که مشخص است، صحت نهایی طبقه‌بندی برای سناریوهای اول و دوم به‌ترتیب حدود 99 و 95 درصد است. همچنین، همان‌طور که از شکل 5 مشخص است، خطای نهایی طبقه‌بندی برای سناریوهای اول و دوم درنهایت به مقدار 0001/0 و 001/0 کاهش یافته است.

شکل 6 مقادیر صحت، دقت، حساسیت و اختصاصیت الگوریتم پیشنهادی را به تفکیک هر سناریو، در نمودار بار نشان می‌دهد. مطابق با شکل 6 همان‌طور که مشخص است، کلیه مقادیر مربوط به صحت، دقت، حساسیت و اختصاصیت حاصل‌شده براساس شبکة پیشنهادی برای طبقه‌بندی هر دو سناریو بالای 90 درصد هستند. شکل 7 نمودار ROC36 را برای سناریوهای اول و دوم نشان می‌دهد. مطابق با شکل 7، نمودار ROC برای هر دو سناریو در محدودة 9/0 تا 1 است و در نیمساق سمت چپ قرار دارد.

شکل 8 ماتریس درهم‌ریختگی و نمودار T-Sen را برای سناریوی دوم نشان می‌دهد.

همان‌طور که از شکل 8 مشخص است، تقریباً کلیه نمونه‌ها مربوط به هر کلاس در نمودار T-Sen در لایة Flatten از یکدیگر تفکیک شده‌اند که نشان‌دهندة عملکرد مطلوب روش پیشنهادی است.

 به‌منظور نشان‌دادن کارایی مطلوب روش پیشنهادی بر پایة شبکه‌های تمام کانولوشنی با تابع فعال‌ساز فازی نوع 2، این روش با روش‌های مشابه مقایسه شده است. بدین منظور، از توابع فعال‌سازی Relu و Leaky-Relu به‌جای استفاده از تابع فعال‌سازی فازی نوع 2 در شبکة FCNN استفاده کرده‌ایم. شکل 9 عملکرد معماری پیشنهادی را در مقایسه با دو حالت یادشده نشان می‌دهد. مطابق با شکل 9 همان‌طور که مشاهده می‌شود، شبکة پیشنهادی در ترکیب با تابع فعال‌سازی فازی نوع 2 دارای صحت بیشتر و خطای کمتری در مقایسه با ترکیب شبکه با سایر فعال‌سازی‌ها است که نشان‌دهندة مطلوبیت طراحی معماری پیشنهادی است. با توجه به این موضوع که بیشتر سیستم‌های رادیولوژی موجود در بیمارستان‌های دولتی قدیمی‌اند، تصاویر تولیدی از این سیستم‌ها بیشتر همراه با نویز هستند؛ به همین دلیل، لازم است معماری شبکة پیشنهادی به گونه‌ای طراحی شود تا در مقابل نویز مقاومت قابل انتظاری داشته باشد. بدین منظور، برای ارزیابی شبکة پیشنهادی، نویز سفید گاوسی را به تصاویر اشعه ایکس قفسه سینه در SNRهای مختلف (4- تا 20 دسی‌بل) اضافه کردیم.

نویز اضافه‌شده به تصاویر در شکل 10 نشان داده شده است. همچنین، صحت حاصل‌شده در هر SNR در شکل 11 گزارش شده است. براساس این شکل، شبکة پیشنهادی می‌تواند در طیف وسیعی از SNRهای مختلف، مقاومت خوبی داشته باشد؛ به طوری که صحت طبقه‌بندی در SNR=-4dB هنوز هم بالای 80 درصد است. دلیل مقاومت شبکة پیشنهادی را می‌توان در 3 عامل زیر یافت:

1) استفاده از توابع فعال‌سازی فازی تایپ 2 در لایه‌های کانولوشنال به‌جای توابع Relu و Leaky Relu؛ 2) استفاده از فیلتر گسترده در لایة اول کانولوشن و 3) استفاده از فیلترهای با اندازة کوچک در لایه‌های میانی. براساس شواهد موجود، از شبکة پیشنهادی می‌توان برای تصاویر نویزی با پیش‌شرط صحت بالا نیز استفاده کرد.

  عملکرد روش پیشنهادی با پژوهش‌های اخیر در جدول 4 مقایسه شده است. همان‌طور که از جدول 4 مشاهده می‌شود، صحت طبقه‌بندی برای روش پیشنهادی در مقایسه با پژوهش‌های پیشین امیدوارکننده است. توزیع داده‌ها برای مجموعه‌های آموزش و آزمون در کلیه پژوهش‌های پیشین یکسان بوده است؛ با این حال، به‌دلیل شرایط شبیه‌سازی مختلف، تغییر در پایگاه داده‌ها و عوامل دیگر، مقایسة یک‌به‌یک با دیگر مطالعات، امری نامطلوب تلقی می‌شود.

باوجود عملکرد مطلوب روش پیشنهادی، این کار نیز مانند سایر پژوهش‌ها دارای معایبی است. یک مطالعة واقع‌بینانة دیگر لازم است تا روش پیشنهادی با سناریوهای بیشتری ازجمله بیماری‌های سارس و مرس ارزیابی شود. متأسفانه به‌دلیل عدم دسترسی به این داده‌ها، این سناریوها در این مطالعه بررسی نشده‌اند. با این حال، با گسترش روش پیشنهادی و راه‌یابی آن به حوزة عملی و کاربردی، روش پیشنهادی می‌تواند در آینده‌ای نزدیک به‌عنوان دستیار پزشکان در طول درمان بیماران، استفاده و سبب کاهش خطای تشخیص بصری و درنتیجه، کاهش مرگ‌ومیر افراد شود.

 

 

 

شکل (4): نمایش گرافیکی از طراحی معماری پیشنهادی در این پژوهش.

 

 

شکل (5): صحت طبقه‌بندی سناریوهای اول و دوم در 200 تکرار برای داده‌های آموزش و ارزیابی.

 

شکل (6): مقادیر صحت، دقت، حساسیت و اختصاصیت حاصلشده براساس شبکة پیشنهادی برای سناریوی اول و دوم.

 

شکل (7): نمودار ROC برای سناریوی اول و دوم.

 

شکل (8): ماتریس درهم‌ریختگی و نمودار T-SEN حاصل‌شده از شبکة پیشنهادی برای سناریوی دوم.

 

شکل (9): مقایسة شبکة پیشنهادی با روش‌های مشابه برای سناریوی دوم در 200 تکرار.

 

 

شکل (10): نویز اضافه‌شده به تصاویر در SNRهای مختلف.

 

 

شکل (11): مقایسة روش پیشنهادی با روش‌های مشابه در محیط نویزی.

 

جدول (4): مقایسة روش پیشنهادی با مطالعات اخیر.

Methods

Dataset

# of classes

Acc (%)

Se (%)

Sp (%)

Khalifa et al. [18]

Private

2

99

-

-

Chuchan et al. [17]

Public

3

96.39

-

-

Stephen et al. [19]

Public

2

95

-

-

Liang et al. [20]

Public

2

90

-

-

Chang et al. [13]

Public

3

98.97

89.39

99.75

Borghesi et al. [14]

Public

2

96

96

98

Ardakani et al. [23]

Private

2

99.02

98.04

100

Narin et al. [15]

Public

2

98

-

-

P-M )FCNN with Type-2 Fuzzy Activation Function(

Public

3

99

100

99.02

 

 

5- نتیجه‌گیری

در این مطالعه یک روش جدید براساس شبکه‌های یادگیری عمیق برای تشخیص خودکار کووید-19 در دو سناریوی مختلف با استفاده از تصاویر اشعه ایکس قفسه سینه ارائه شده است. برای معماری شبکة پیشنهادی، از 7 لایه کانولوشنال به همراه توابع فعال‌سازی فازی نوع 2 به‌منظور انتخاب و استخراج ویژگی‌های خودکار و یک لایة سافت‌مکس به‌منظور طبقه‌بندی کلاس‌ها استفاده شده است. صحت نهایی روش پیشنهادی برای طبقه‌بندی سناریوی اول (سالم و کووید-19) و سناریوی دوم (سالم، پنومونیا و کووید-19) به‌ترتیب حدود 99 و 95 درصد است که در مقایسه با پژوهش‌های پیشین امیدوارکننده است. با توجه به عملکرد مطلوب روش پیشنهادی می‌توان از آن برای تشخیص خودکار کووید-19 بدون نیاز به تشخیص بصری استفاده کرد.

 

 

[1] تاریخ ارسال مقاله: 02/03/1400

تاریخ پذیرش مقاله: 27/09/1400

نام نویسندۀ مسئول: کامل صباحی

نشانی نویسندۀ مسئول: ایران – نمین - دانشگاه محقق اردبیلی - دانشکده فناوری‌های نوین - گروه علوم مهندسی

1 Novel Coronavirus (COVID-19)

2 Severe Acute Respiratory Syndrome

3 Septic Shock

4 World Health Organization (WHO)

5 Reverse Transcription-Polymerase Chain Reaction (RT-PCR)

6 Chest Scan

7 Computerized Tomography (CT)

8 Digital Radiography (DR)

9 X-ray Images

10 Pneumonia

11 Deep Transfer Learning Networks

12 Support Vector Machine (SVM)

13 Generative Adversarial Networks (GANs)

14 Convolutional

15 Fully Connected

16 Deep Neural Networks

17 Random Forest (RF)

18 Sonography

19 Type-2 Fuzzy Sets

20 Generator

21 Discriminator

22 Feedforward

23 Back Propagation

24 Loss Function

25 Pooling Layer

26 Fully Connected

27 Over Fitting

28 Dropout

29 Batch Normalization

30 Down Sampling

31 Max-Pooling

32 Softmax

33 Mean squared error (MSE)

34 Cross- entropy

35 Google Colab

[1] S. Fauci, H. C. Lane, and R. R. Redfield, "Covid-19—navigating the uncharted," ed: Mass Medical Soc, 2020.
[2] T. P. Velavan and C. G. Meyer, "The COVID‐19 epidemic," Tropical medicine & international health, Vol. 25, No. 3, p. 278, 2020.
[3] B. Pfefferbaum and C. S. North, "Mental health and the Covid-19 pandemic," New England Journal of Medicine, Vol. 383, No. 6, pp. 510-512, 2020.
[4] J. Daniel, "Education and the COVID-19 pandemic," Prospects, Vol. 49, No. 1, pp. 91-96, 2020.
[5] S. B. Omer, P. Malani, and C. Del Rio, "The COVID-19 pandemic in the US: a clinical update," Jama, vol. 323, no. 18, pp. 1767-1768, 2020.
[6] P. Dashraath et al., "Coronavirus disease 2019 (COVID-19) pandemic and pregnancy," American journal of obstetrics and gynecology, Vol. 222, No. 6, pp. 521-531, 2020.
[7] L. Lan et al., "Positive RT-PCR test results in patients recovered from COVID-19," Jama, Vol. 323, No. 15, pp. 1502-1503, 2020.
[8] K. Syal, "Guidelines on newly identified limitations of diagnostic tools for COVID‐19 and consequences," Journal of medical virology, Vol. 93, No. 4, pp. 1837-1842, 2021.
[9] C. Martin et al., "Dynamics of SARS-CoV-2 RT-PCR positivity and seroprevalence among high-risk healthcare workers and hospital staff," Journal of Hospital Infection, Vol. 106, No. 1, pp. 102-106, 2020.
[10] H. S. Maghdid, A. T. Asaad, K. Z. Ghafoor, A. S. Sadiq, S. Mirjalili, and M. K. Khan, "Diagnosing COVID-19 pneumonia from X-ray and CT images using deep learning and transfer learning algorithms," in Multimodal Image Exploitation and Learning 2021, 2021, vol. 11734: International Society for Optics and Photonics, p. 117340E.
[11] S. Sheykhivand et al., "Developing an efficient deep neural network for automatic detection of COVID-19 using chest X-ray images," Alexandria Engineering Journal, Vol. 60, No. 3, pp. 2885-2903, 2021.
[12] A. Saygılı, "A new approach for computer-aided detection of coronavirus (COVID-19) from CT and X-ray images using machine learning methods," Applied Soft Computing, Vol. 105, p. 107323, 2021.
[13] M. C. Chang, Y.-K. Park, B.-O. Kim, and D. Park, "Risk factors for disease progression in COVID-19 patients," BMC infectious diseases, Vol. 20, No. 1, pp. 1-6, 2020.
[14] A. Borghesi et al., "Radiographic severity index in COVID-19 pneumonia: relationship to age and sex in 783 Italian patients," La radiologia medica, Vol. 125, No. 5, pp. 461-464, 2020.
[15] A. Narin, C. Kaya, and Z. Pamuk, "Automatic detection of coronavirus disease (covid-19) using x-ray images and deep convolutional neural networks," Pattern Analysis and Applications, pp. 1-14, 2021.
[16] P. K. Sethy, S. K. Behera, P. K. Ratha, and P. Biswas, "Detection of coronavirus disease (COVID-19) based on deep features and support vector machine," 2020.
[17] V. Chouhan et al., "A novel transfer learning based approach for pneumonia detection in chest X-ray images," Applied Sciences, Vol. 10, No. 2, p. 559, 2020.
[18] N. E. M. Khalifa, M. H. N. Taha, A. E. Hassanien, and S. Elghamrawy, "Detection of coronavirus (covid-19) associated pneumonia based on generative adversarial networks and a fine-tuned deep transfer learning model using chest x-ray dataset," arXiv preprint arXiv:2004.01184, 2020.
[19] O. Stephen, M. Sain, U. J. Maduh, and D.-U. Jeong, "An efficient deep learning approach to pneumonia classification in healthcare," Journal of healthcare engineering, Vol. 2019, 2019.
[20] I. D. Apostolopoulos and T. A. Mpesiana, "Covid-19: automatic detection from x-ray images utilizing transfer learning with convolutional neural networks," Physical and Engineering Sciences in Medicine, Vol. 43, No. 2, pp. 635-640, 2020.
[21] H. Wu, P. Xie, H. Zhang, D. Li, and M. Cheng, "Predict pneumonia with chest X-ray images based on convolutional deep neural learning networks," Journal of Intelligent & Fuzzy Systems, no. Preprint, pp. 1-15, 2020.
[22] G. E. Hinton, N. Srivastava, A. Krizhevsky, I. Sutskever, and R. R. Salakhutdinov, "Improving neural networks by preventing co-adaptation of feature detectors," arXiv preprint arXiv:1207.0580, 2012.
[23] A. A. Ardakani, A. R. Kanafi, U. R. Acharya, N. Khadem, and A. Mohammadi, "Application of deep learning technique to manage COVID-19 in routine clinical practice using CT images: Results of 10 convolutional neural networks," Computers in Biology and Medicine, Vol. 121, p. 103795, 2020.
[25] T. Iqbal and H. Ali, "Generative adversarial network for medical images (MI-GAN)," Journal of medical systems, Vol. 42, No. 11, pp. 1-11, 2018.
[26] N. U. Din, K. Javed, S. Bae, and J. Yi, "A novel GAN-based network for unmasking of masked face," IEEE Access, Vol. 8, pp. 44276-44287, 2020.
[27] W. Rawat and Z. Wang, "Deep convolutional neural networks for image classification: A comprehensive review," Neural computation, Vol. 29, No. 9, pp. 2352-2449, 2017.
[28] G. Yao, T. Lei, and J. Zhong, "A review of convolutional-neural-network-based action recognition," Pattern Recognition Letters, vol. 118, pp. 14-22, 2019.
[29] A. Dhillon and G. K. Verma, "Convolutional neural network: a review of models, methodologies and applications to object detection," Progress in Artificial Intelligence, Vol. 9, No. 2, pp. 85-112, 2020.
[30] J. M. Mendel and R. B. John, "Type-2 fuzzy sets made simple," IEEE Transactions on fuzzy systems, Vol. 10, No. 2, pp. 117-127, 2002.
[31] A. Beke and T. Kumbasar, "Learning with type-2 fuzzy activation functions to improve the performance of deep neural networks," Engineering Applications of Artificial Intelligence, Vol. 85, pp. 372-384, 2019.
[32] A. Beke and T. Kumbasar, "Learning with type-2 fuzzy activation functions to improve the performance of deep neural networks," Engineering Applications of Artificial Intelligence, Vol. 85, pp. 372-384, 2019.