Automatic Segmentation of Ischemic Stroke Lesions in CT Perfusion Maps Using Deep Learning Networks

Document Type : Research Article

Authors

1 Phd Student, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran

2 Associate Prof, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran

3 Assistant Professor, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran

Abstract

Stroke is the third leading cause of death and the largest cause of acquired disability worldwide. Classification of stroke lesions is vital in recovery, diagnosis, outcome assessment, and treatment planning. The current standard approach for segmenting ischemic stroke lesions is based on thresholding of computed tomography perfusion (CTP) maps. However, this detection approach is inaccurate (the dice similarity coefficient is around 68%). Accordingly, several machine learning-based techniques have recently been proposed to improve the segmentation accuracy of ischemic stroke lesions. Although these studies have achieved significant results, they still need to be improved before being used in real practice. This research presents a new technique based on deep learning for the segmentation of ischemic stroke lesions in CTP maps. The proposed network architecture includes the 7 Graph Convolutional layer, which can automatically perform feature selection/extraction and classify the resulting feature vector. In this study, the ISLES 2018 database was used to train the proposed network. The indices of the Dice Similarity coefficient and Jaccard Index based on the proposed model are 75.41% and 74/52%, respectively, which is a significant improvement compared to recent studies. In addition, the performance of the proposed model in noisy environments is very promising; so, at SNR=-4, the accuracy of networks is still above 60%.

Keywords

Main Subjects


1- مقدمه 
سکتۀ مغزی  یکی از علل اصلی مرگ‌ومیر و ناتوانی در سراسر جهان است که سالانه 15 میلیون نفر را تحت تأثیر قرار می‌دهد [1]. از این تعداد، نیمی از کسانی که پس از سکتۀ مغزی زنده می‌مانند، دچار ناتوانی مزمن می‌شوند [2]. تقریباً 90 درصد سکته‌های مغزی از نوع ایسکمیک  هستند که توسط یک شریان مسدودشده ایجاد می‌شوند و به کاهش جریان خون در مغز، ایسکمی بافتی و آنفارکتوس  منجر می‌شوند [3]. سکتۀ مغزی ناشی از نوع دوم به دلیل ترکیدگی یا پارگی یک رگ خونی ضعیف‏شده به وجود می‌آید [4]. مطابق گزارش سازمان غذا و دارو، 87 درصد از سکته‌های مغزی در ایالات‌متحده از نوع ایسکمیک و 13 درصد از نوع هموراژیک  هستند. از جملۀ پارامترهای مهم در عوامل عمدۀ سکته مغزی می‌توان به سن، جنسیت، نژاد و قومیت اشاره کرد. همچنین، از عوامل بالینی می‌توان به داشتن بیماری زمینه‌ای از جمله فشارخون بالا، بیماری‌های قلبی و دیابت اشاره کرد. علاوه بر این، برای پارامترهای سبک زندگی می‌توان کم‌تحرکی، چاقی، تغذیۀ نامناسب، مصرف دخانیات و الکل را در نظر گرفت [5]. تشخیص سکتۀ مغزی شامل یک تاریخچۀ پزشکی دقیق، معاینۀ فیزیکی، عصبی و یک آزمایش تصویربرداری مغزی مانند اسکن CT یا تصویربرداری رزونانس مغناطیسی (MRI)  است که به‌ منظور رد سایر احتمالات در تشخیص از جمله تومورهای مغزی، انتخاب نوع روش جراحی و تجویز دارو به ‌منظور حل کردن لخته‌های خونی انجام می‏شود [6]. 
تشخیص و بخش‌بندی خودکار ضایعه‌های سکتۀ مغزی ایسکمیک به ‌صورت سنتی با به‌کارگیری روش سنتی و استفاده از رادیولوژیست عصبی انجام می‏شود. در روش سنتی، رادیولوژیست عصبی به ‌صورت بصری ناحیۀ آنفارکتوس یا سایه را شناسایی و پزشک متخصص را از نوع عروق لخته‌شده مطلع می‏کند [7]؛ با این‌ حال، نوع ضایعه‌ها با یکدیگر همسان نیستند و از لحاظ شکل ظاهری، اندازه و محل قرارگیری متفاوت هستند. به‌ این‌ ترتیب، تفسیر و تشخیص از تصاویر تصویربرداری مغزی فرآیندی پیچیده است و به دانش تخصصی نیاز دارد [8]. علاوه بر این، تفسیر سنتی ضایعه‌های سکتۀ مغزی توسط رادیولوژیست عصبی فرآیندی زمان‌بر، مستعد خطا و دارای دقت کم است [9]. همچنین، در صورت تشخیص اشتباه ممکن است پیامدهایی جبران‌ناپذیر را به همراه داشته باشد. به‌ علاوه، ممکن است کنتراست تصاویر اخذشده کم باشد و رادیولوژیست عصبی به دلیل وجود نویز در تصاویر نتواند تشخیصی درست از ناحیۀ ضایعه و عروق گرفته‌شده داشته باشد [10]. به‏تازگی، پژوهش‏هایی بسیار در زمینۀ تشخیص خودکار سکتۀ مغزی ایسکمیک ارائه شده‏اند که در ادامه، هر یک از آن‏ها را بررسی خواهیم کرد.
سلطان‌پور و همکاران [11] از چهار شبکۀ U-Net دوبعدی به ‌منظور تقسیم‌بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک استفاده کرده‏اند. در مرحلۀ پیش‌پردازش مدل این پژوهشگران، نواحی پرت حذف ‌شدند و مجموعۀ داده با استفاده از چرخش، مقیاس‏بندی و اضافه کردن نویز تقویت شد. در مرحلۀ بعد، شبکه‌های U-Net موازی توسط نقشه‌های پرفیوژن توموگرافی کامپیوتری (CTP)  آموزش داده شدند. عملکرد تقسیم‌بندی مدل این پژوهشگران با استفاده از معیارهای ضریب تشابه تاس (DSC)  و شباهت حجمی ارزیابی شد و از مجموعۀ داده‌های چالش ISLES 2018 به ‌منظور استفاده در مجموعۀ آموزش و ارزیابی شبکه استفاده شد. لیو  و همکاران [12] از تصاویر CTP به‌ منظور بخش‌بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک استفاده کردند. این پژوهشگران در مدل پیشنهادی خود از شبکه‌های مولد تخاصمی (GANs)  به ‌منظور تولید تصویربرداری بر وزن انتشار (DWI)  استفاده کردند. به‌ طور کلی، ساختار شبکۀ کانولوشنال  این پژوهشگران شامل یک مولد، یک تفکیک‌کننده  و یک تقسیم‌کننده  است. DSC این پژوهشگران بر اساس اعتبارسنجی 4-برابری  49 درصد گزارش شده است. دولز  و همکاران [13] به ‌منظور تقسیم‌بندی ضایعات سکتۀ مغزی ایسکمیک از شبکه‌های U-Net اصلاح‌شده استفاده کردند. معماری این پژوهشگران از سه جنبۀ مختلف دارای اهمیت بود. اول اینکه، به‌جای ترکیب مودالیته‌های تصویر موجود در یک ورودی، هر یک از آن‌ها در مسیری متفاوت پردازش شده‌اند تا از اطلاعات منحصربه‌فرد با عملکردی بهتر بهره‌برداری شود. دوم اینکه، شبکۀ پیشنهادی این پژوهشگران به ‌طور متراکم متصل بود (هر لایه به تمام لایه‌های بعدی متصل است). سوم اینکه، این پژوهشگران با الهام از مدل شبکۀ Inception، ماژول‌های استاندارد U-Net را با دو بلوک کانولوشن پیچشی در لایه‌های ورودی به ‌منظور عملکرد بهتر در مقیاس‌های متفاوت بهبود داده‌اند. نتایج این پژوهش نشان داد اطلاعات چندوجهی می‌توانند در مقایسه با راهبردهای ساده‌تر، عملکردی بهتر را از خود به نمایش بگذارند. ونگ  و همکاران [14] چارچوبی جدید مبتنی بر DWI از نقشه‌های CTP را برای به دست آوردن کیفیت بهتر به‌ منظور تقسیم‌بندی دقیق‌تر ضایعه‌های مغزی ارائه کردند. مدل پیشنهادی این پژوهشگران شامل سه مؤلفۀ مبتنی بر شبکه‌های عصبی کانولوشنال (CNN)  بود که به‌ صورت سرتاسر و پایان به پایان آموزش داده می‌شد. این پژوهشگران در مسابقۀ چالش تصاویر ISLES 2018 رتبۀ اول را به دست آوردند. آلبرت  و همکاران [15] با استفاده از تصاویر CTP و CT، سکتۀ مغزی ایسکمیک را به طور خودکار بخش‏بندی کرده‏اند. به این منظور، این پژوهشگران از مجموعۀ دادۀ چالشی ISLES استفاده کرده‏اند. همچنین، آن‌ها به‌ منظور بخش‌بندی تصاویر از یک شبکۀ U-Net بهبودیافته استفاده کردند. مجموعۀ ارزیابی نمونه‌ها شامل 94 تصویر ضایعه برای آموزش شبکه و 62 تصویر برای بخش آزمون شبکه بود. نحوۀ ارزیابی شبکۀ پیشنهادی آن‌ها بر اساس روش 10-برابری انجام شده است و در نهایت، DSC حاصل‌شده برابر 49 درصد به‌ منظور بخش‌بندی تصاویر توسط این پژوهشگران گزارش شده است. می‌توان ‌دقت کم در تشخیص ضایعات را از جملۀ معایب این پژوهش در نظر گرفت. غنمات  و همکاران [16] مدلی جدید را بر اساس رویکردهای یادگیری عمیق  به‌ منظور بخش‌بندی ضایعۀ سکتۀ مغزی ایسکمیک ارائه کردند. این پژوهشگران در این کار از فاصلۀ اقلیدسی برای محاسبۀ میانگین فاصلۀ هر پیکسل در جهت راست و پایین استفاده کردند. آن‏ها توانستند ضریب تشابه تاس را نسبت به پژوهش‌های اخیر 5/2 درصد بهبود ببخشند. راجو  و همکاران [17] از شبکه‌های U-Net به ‌منظور بخش‌بندی و تشخیص خودکار سکتۀ مغزی ایسکمیک استفاده کرده‏اند. آن‌ها یک مدل عمیق مشتق‏شده از U-Net را در پژوهش خود ارائه داده‌اند که می‌توانست تمامی نقشه‌های CTP را به‌ طور موازی و مستقل پردازش کند. ضریب تشابه تاس گزارش‌شده توسط این پژوهشگران حدود 42 درصد بود. سلطان‌پور و همکاران [18] یک شبکۀ عصبی عمیق را به ‌منظور بخش‌بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک ارائه کردند. به این منظور، در این پژوهش، از معماری اصلاح‌شدۀ شبکۀ U-Net استفاده شد. در داخل این شبکه، از CNNهای چندمقیاسی و اتصالات میان‏بر مبتنی بر CNN استفاده شده بود. نتیجۀ نهایی گزارش‌شده توسط آن‌ها دارای شاخص تشابه تاس 68 درصد بود. 
مطابق بررسی‌های پژوهش‌های پیشین، هر کدام از این مطالعه‏ها دارای مزایا و معایبی بوده است؛ با این‌ حال، مشکل اساسی در بخش‌بندی خودکار ضایعات سکتۀ مغزی، DSC کمتر از 68 درصد است. علاوه بر این، تقریباً تمامی شبکه‌های پیشین بازدهی عملیاتی در محیط‌های نویزی را ندارند که این امر استفاده از الگوریتم پیشنهادی پژوهشگران را در کاربردهای بلادرنگ در حضور عدم قطعیت‌های مختلف همچون نویز به‌ منظور بخش‌بندی تصاویر زیر سؤال می‌برد. روش پیشنهادی این پژوهش مبتنی بر شبکه‌های گراف کانولوشنال عمیق است که در نظر دارد از چالش‌های مربوط گذر کند تا بتوان از آن در کاربرد عملی به‌ عنوان دستیار پزشکی برای بخش‌بندی خودکار سکتۀ مغزی ایسکمیک استفاده کرد. نوآوری مطالعۀ حاضر را می‌توان در موارد زیر جست‌وجو کرد:
الف) ارائۀ مدلی خودکار و پایان به پایان بر اساس ترکیب نظریۀ گراف و شبکه‌های کانولوشنال عمیق بدون نیاز به بلوک دیاگرام انتخاب/استخراج ویژگی.
ب) دست‏یابی به بیشترین مقادیر صحت  و DSC در مقایسه با پژوهش‌های گذشته به ‌منظور بخش‏بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک با استفاده از تصاویر پرفیوژن CT.
پ) ارائۀ مدلی خودکار با قابلیت مقاومت زیاد در مقابل نویزهای محیطی تا محدودۀ SNR=-4 dB.
ادامۀ مقاله به صورت زیر سازمان یافته است: بخش دوم پایگاه دادۀ استفاده‏شده را به همراه نظریۀ ریاضی شبکه‌های گراف کانولوشنال بررسی می‏کند. بخش سوم روش پیشنهادی پژوهش حاضر را ارائه می‌دهد. بخش چهارم نتایج شبیه‌سازی را بر اساس روش پیشنهادی ارائه‏شده مشخص می‏کند و در نهایت، بخش پنجم مربوط به نتیجه‌گیری است.

2- مواد و روش‌ها
در این بخش، ابتدا پایگاه دادۀ‌ مربوط به نقشه‌های سکتۀ مغزی ایسکمیک شرح داده می‌شود. سپس، پیش‌زمینۀ ریاضی مربوط به شبکه‌های گراف کانولوشنال بررسی خواهد شد.
2-1- پایگاه دادۀ ISLES 2018
پایگاه دادۀ ISLES 2018 به‌ عنوان جامع‌ترین مجموعۀ داده به ‌منظور بخش‌بندی خودکار سکتۀ مغزی ایسکمیک شناخته می‌شود. می‌توان بقیۀ پایگاه‏های دادۀ عمومی موجود را مشتقی از این مجموعۀ داده در نظر گرفت. این پایگاه داده شامل مجموعۀ داده‌های مربوط به 103 بیمار است که با هدف تقسیم‌بندی هستۀ ضایعۀ سکتۀ مغزی از تصاویر CTP اخذ شده است. همچنین، این مجموعۀ داده شامل اسکن‌هایCTP  چهاربعدی، نقشه‌های CTP سه‌بعدی شامل MTT، CBF، CBV و Tmax است. نمونه‌ای از این نقشه‌ها در شکل (1) نمایش داده شده است. در این پایگاه، هر بیمار در عرض 3 ساعت از تصویربرداری CTP پایه، تحت DW-MRI قرار گرفته است تا اعتبارسنجی توسط متخصص رادیولوژی انجام شود. تصاویر به‌ صورت قطعه‌قطعه با تعداد برش محوری متغیر، از 2 تا 22 قطعه بسته به بیمار، با فاصلۀ 5 میلی‌متری و وضوح 256×256 اخذ شده‌اند [19].

 
شکل (1): نقشه‌های CTP به همراه تصویر طرف مقابل آن‌ها در پایگاه داده ISLES 2018 [44].
2-2- شبکۀ کانولوشنال گراف
ایدۀ اولیۀ شبکۀ کانولوشنال گراف  برای اولین بار توسط مایکل دفرارد  و همکاران در سال 2016 مطرح شد [20]. این پژوهشگران برای اولین بار از پردازش سیگنال در حوزۀ گراف و نظریۀ طیفی گراف  در تعریف تابع کانولوشنی استفاده کرده‏اند که این موضوع امکان استفاده از شبکه‌های کانولوشنی را در قالب نظریۀ گراف فراهم می‏کند.
در نظریۀ گراف، داشتن ماتریس درجه و ماتریس مجاورت دارای اهمیتی ویژه‌ است. اتصال هر یک از رأس‌ها در گراف با استفاده از ماتریس مجاورت حاصل می‌شود. همچنین، با داشتن ماتریس مجاورت، می‌توان ماتریس درجه را نیز به دست آورد. این ماتریس، ماتریس قطری است که درایه‌های قطر آن با مجموع لبه‌های متصل به رأس متناظر با درایه برابر هستند. ماتریس درجه به ‌صورت   و ماتریس گراف به ‌صورت  نمایش داده می‏شود و iامین عنصر قطری ماتریس درجه به ‌صورت زیر تعریف می‌شود [21]:
(1)     

ماتریس لاپلاسین نیز به صورت رابطۀ زیر ‌تعریف می‏شود:
(2)     
     

مطابق رابطۀ بالا، همان‌طور که مشخص است، حاصل تفریق دو ماتریس درجه و ماتریس مجاورت ماتریس لاپلاسین را شکل می‌دهد. از این ماتریس به ‌منظور محاسبۀ توابع پایۀ گراف استفاده می‌شود. توابع پایۀ گراف را می‌توان با استفاده از تجزیه به مقادیر تکین (SVD)  در ماتریس لاپلاسین به دست آورد. همچنین، ماتریس لاپلاسین را می‌توان با در نظر گرفتن ماتریس بردارهای ویژه و ماتریس مقادیر تکین به فرم رابطۀ (2) تعریف کرد. بر اساس رابطۀ (2)، ستون‌های ماتریس بردارهای ویژه با بردارهای ویژۀ ماتریس لاپلاسین متناظر هستند. تبدیل فوریه نیز بر اساس همین بردارهای ویژه امکان‌پذیر است و پایه‌های فوریه با داشتن مقادیر ویژۀ قطری شامل   به صورت رابطۀ زیر تعریف می‏شوند:
(3)     

برای درک بهتر، تبدیل فوریه و عکس تبدیل فوریۀ یک سیگنال مانند  به‏ترتیب در روابط (4) و (5) ‌تعریف می‏شوند:
(4)     
(5)     
بر اساس رابطۀ (4)،  نمایش‌دهندۀ تبدیل فوریۀ گراف است. همچنین، بر اساس رابطۀ (5)، بردار ویژگی برای سیگنالی همچون q با داشتن پایه‌های فوریه و تبدیل فوریۀ گراف امکان‌پذیر است.
عملگر کانولوشن گراف نیز با داشتن کانولوشن دو سیگنال در حوزۀ گراف توسط تبدیل فوریۀ هر سیگنال ‌محاسبه می‏شود. برای درک بهتر، کانولوشن دو سیگنال z و y به همراه اپراتور  به‌ صورت رابطۀ زیر تعریف می‌شود:
(6)     

در رابطۀ بالا، از تابع فیلترکنندۀ   برای توصیف یک عملگر کانولوشن گراف در ترکیب با شبکه‌های عصبی استفاده شده است. بر اساس رابطۀ بالا، z  ورژن فیلترشده توسط   است:
(7)     

با جای‏گذاری ماتریس لاپلاسین و تجزیه به مقادیر تکین و بردارهای ویژه، کانولوشن گراف به صورت زیر ‌تعریف می‏شود [22]:
(8)     
2-3- الگوریتم خوشه‌بندی تکراری ساده
تصویر ورودی I با استفاده از تکنیک سوپرپیکسل الگوریتم خوشه‌بندی تکراری ساده (SLIC)  برای تولید نمودار مجاورت منطقۀ G به چندین بخش مجزا   تقسیم شد [23].  ، تعداد مناطق ارائه‌دهنده، به صورت تصادفی انتخاب شد که P×Q در اینجا خلاصه‌شدۀ وضوح فضایی  است. با تقسیم هر کانال بر   که در آن B عمق بیت هر کانال را نشان می‌دهد [23] و مطابق آن ویژگی‌های تصویر در محدودۀ [0 و 1] نرمال می‌شوند، سوپرپیکسل‌های Ri با رئوس vi در شبکۀ مجاورت منطقه حاصل مشخص می‌شوند که هر کدام با یک بردار ویژگی یک‌بعدی fi مشخص می‌شود که از ناحیۀ مربوطه به دست آمده است. میانگین شدت برای منطقۀ Ri با میانگین شدت پیکسل در نظر گرفته شد. لبه‌های وزن‌دار گره‌هایی را به یکدیگر مرتبط می‌کنند که نواحی مجاور را نشان می‌دادند. فرمول زیر یک تابع وزن‏دهی گاوسی را نشان می‌دهد که وزن‌ها به ‌واسطۀ آن به دست می‌آیند:
(9)     
که در آن:
(10)     

و β در اینجا یک پارامتر آزاد است.
یک ماتریس مجاورت ناحیه ، A = [aij] ∈ RN×N، مطابق رابطۀ زیر است:
(11)     

پهمچنین، یک ماتریس ویژگی ناحیه  X ∈ RN×1 وجود دارد که نشان‌دهندۀ N رأس است که هر کدام دارای ویژگی‌هایی در R1×1 است.

3- روش پیشنهادی
روش پیشنهادی در این مقاله در این بخش ارائه خواهد شد. ساختار اصلی مدل پیشنهادی در شکل (2) نمایش داده شده است.
3-1- پیش‌پردازش داده‌ها
ابتدا، عملیات پیش‌پردازش برای هر تصویر با در نظر گرفتن واحد ضریب هانسفیلد  انجام و شدت پیکسل‌های بیشتر از 150 و زیر صفر حذف و با صفر جایگزین می‏شود. سپس، اندازۀ تصاویر 256 256 با تمرکز بر بخش یادشده در نظر گرفته می‌شود. سپس، به منظور جلوگیری از پدیدۀ بیش‌برازش، عملیات افزایش دادگان بر روی تصاویر انجام شد. به این منظور، تصاویر 0-20 درجه به چپ - راست و راست - چپ چرخانده شدند.

3-2- نحوۀ تشکیل گراف 
نمایش گراف از طریق روش خوشه‌بندی تکراری خطی ساده به دست می‌آید. این رویکرد تصاویر را خوشه‌بندی می‌کند و دنباله‌ای از سوپرپیکسل‌ها را به‌ عنوان مناطق مختلف تصویر استخراج می‌کند. شکل (3) نحوۀ ایجاد یک گراف را با استفاده از این رویکرد نشان می‌دهد. شکل (3) نشان می‌دهد هر گره از این شبکه با ناحیه‌های سوپرپیکسلی بازیابی‏شده با استفاده از روش خوشه‌بندی تکراری خطی ساده مطابقت دارد. علاوه بر این، میانگین شدت پیکسل‌ها در هر منطقه به ‌عنوان بردار ویژگی مربوط به هر ناحیه و گره شبکه در نظر گرفته می‌شود. علاوه بر این، لبه‌های نمودار بسته به فاصله و همسایگی هر ناحیه  

 
شکل (2): بلوک دیاگرام مدل عمیق پیشنهادی به ‌منظور طبقه‌بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک

 
شکل (3): نحوۀ تشکیل گراف از تصاویر CT
 
شکل (4): شمای گرافیکی از معماری شبکۀ پیشنهادشده

 
در حین ایجاد یک ماتریس مجاورت گراف بررسی می‌شوند. در تشکیل گراف، مکان‌های همسایه به هم مرتبط هستند؛ اما مناطق غیرهمسایه به هم مرتبط نیستند.

3-3- معماری شبکۀ عمیق پیشنهادی
معماری شبکۀ پیشنهادی در شکل (4) نمایش داده شده است. مطابق این شکل، مدل پیشنهادی به صورت زیر سازمان یافته است: الف) یک لایۀ کانولوشن روی یک گراف چبیشف  به همراه نرمال‏ساز دسته‌ای ، تابع فعال‌سازی لیکی-رلو  و فیلتر کردن دسته‌ای ؛ ب) معماری مرحلۀ قبل چهار دفعۀ دیگر تکرار می‌شود؛ پ) یک لایۀ حذف  تصادفی به ‌منظور جلوگیری از پدیدۀ بیش‏برازش  و ت) امتیازها در لایه تماماً متصل  با استفاده از تابع سافت مکس  محاسبه می‌شوند. تفاوت در لایه‌های مختلف در شکل (5) نمایش داده شده است. هر گره در گراف ساخته‌شده دارای یک نمونه است؛ زیرا بردار ویژگی هر گره میانگین شدت پیکسل در هر ناحیه در نظر گرفته می‌شود. مستقل از گره‌های شبکه، ابعاد ورودی لایۀ کانولوشن گراف در معماری پیشنهادی 16 پیکسل است. بعد خروجی لایه اول نیز برابر 16 است که بر اساس آن، گراف در نظر گرفته‏شده دارای رئوس A و 16 نمونه در هر گره است. 
مطابق شکل (5)، گراف‌های ایجادشده از مرحلۀ قبل به‌ عنوان ورودی مرحلۀ رمزگذار ویژگی  استفاده می‌شوند و با گره A نمایش داده شده‌اند. لایۀ کانولوشن گراف دوم یک گراف A-node با 16 نمونه را در هر رأس ایجاد می‌کند. عملیات یادشده تا زمانی ادامه می‌یابد که گراف پنجم یک گراف A-node با ابعاد 2 را ایجاد کند. سپس، خروجی استخراج‌شده از مرحلۀ رمزگذاری ویژگی به یک ‌لایۀ حذف تصادفی فرستاده می‌شود و گراف A-node حاصل‌ با دو نمونه در هر گره مسطح می‌شود تا بردار عناصر A ایجاد شود. پس از مسطح شدن، بردار وارد یک ‌لایۀ سافت مکس می‌شود. همچنین، شکل (5) نشان می‌دهد که ترتیب 
 
جدول (1): جزئیات لایه‌های مختلف در معماری پیشنهادی
Layer    Shape of Weight Tensor    Shape of Bias    Number of Parameters
First graph convolution    (O1, 16, 16)    16    256 × O1 + 16
Batch normalization    (16)    16    32
Second graph convolution    ([O2, 16, 16)    16    256 × O2 + 16
Batch normalization    ([16)    16    32
Third graph convolution    (O3, 16, 16)    16    256 × O3 + 16
Batch normalization    (16)    16    32
Fourth graph convolution    (O4, 16, 16)    16    256 × O4 + 16
Batch normalization    (16)    16    32
Fifth graph convolution    (O5, 16, 2)    2    32 × O4 + 2
Batch normalization    (16)    16    32
Softmax layer    -    2    2 × A × O4
    
 
شکل (5): معماری شبکۀ عمیق پیشنهادی به همراه جزئیات لایه‌ها

جدول (2): پارامترهای بهینۀ انتخاب‌شده در معماری شبکۀ پیشنهادی
پارامتر    فضای جست‌و‌جو    مقدار بهینه
بهینه‏ساز    RMSProp, Adam, Sgd, Adamax, Adadelta    Adadelta
تابع خطا    MSE, Cross Entropy    Cross Entropy
تعداد لایه‏های گراف کانولوشنال    3 5 7 10    5
اندازۀ خروجی در لایۀ اول    16 32 64 128    16
اندازۀ خروجی در لایۀ دوم    16 32 64 128    16
اندازۀ خروجی در لایۀ سوم    16 32 64 128    16
اندازۀ خروجی در لایۀ چهارم    16 32 64 128    16
اندازۀ بهینه ساز    4-10×6 5-10×6    4-10×6
مقدار لایۀ حذف تصادفی    0 2/0 3/0 4/0 5/0    3/0
نرخ آموزش    01/0 001/0 0001/0    0001/0

 
هر لایۀ کانولوشنال گراف از بسط چندجمله‌ای چبیشف منحصربه‌فرد است و توسط ضرایب O1، O2، O3 و O4 برای پنج لایۀ کانولوشنال گراف مشخص‌شده تعیین می‌شود. مشخصات شبکۀ پیشنهادی به همراه جزئیات لایه‌ها در جدول (1) نمایش داده شده ‏است.

3-4- مجموعۀ آموزش، ارزیابی و آزمون
شبکۀ پیشنهادی در این مطالعه با استفاده از رویکرد آزمون‌ و خطا بر اساس اعتبارسنجی متقاطع 10برابری آموزش داده شده و ارزیابی شده است. شکل (6) نحوۀ تخصیص دادگان را به صورت ساده‌تر نمایش می‌دهد. مطابق این شکل، کل داده‌ها (100 درصد) به 10 بازۀ مساوی (10 درصد) تقسیم می‌شوند. در مرحلۀ اول، بازۀ 1 تا 9 به عنوان مجموعۀ آموزش انتخاب و بازۀ باقی‌مانده به عنوان مجموعۀ آزمون استفاده می‏شود. این تکنیک با شیفت یک‌بازه‏ای تا 9 مرحله ادامه می‌یابد. بر اساس این روش، همۀ نمونه‌ها در ارزیابی شرکت می‌کنند و پدیدۀ بیش‌برازش در فرآیند آموزش رخ نمی‌دهد.
جدول (2) پارامترهای بهینۀ انتخاب‌شده برای طراحی معماری پیشنهادی را نشان می‌دهد. همان‌طور که از این جدول مشخص است، از تعداد لایه‌های مختلف، الگوریتم‌های بهینه‌سازی مختلف و غیره استفاده و بهترین مقدار برای معماری پیشنهادی انتخاب شده است.

 
شکل (6): نحوۀ تخصیص دادگان برای مجموعۀ آموزش و آزمون

4- یافته‏ها
نتایج مربوط به روش پیشنهادی در این بخش ارائه شده است. 
کلیۀ شبیه‌سازی‌ها در این مطالعه با استفاده از پلت‏فرم کلاب  انجام شده‏اند که مشخصات آن به شرح زیر است: رم 25 گیگابایت و Tesla k90 GPU. نتایج تقسیم‌بندی با استفاده از معیارهای ضریب تشابه تاس و شاخص جاکارد  ارزیابی شد. روابط معیارهای در نظر گرفته‌شده به صورت زیر هستند:
(12)     
(13)     

که در آن‏ها S و T به‏ترتیب نتیجۀ تقسیم‌بندی و حقیقت عینی را نمایش می‌دهند. همچنین، معیارهایی دیگر از جمله صحت، دقت، حساسیت و  کاپا کوهن  در این پژوهش برای ارزیابی مدل پیشنهادی استفاده شده‏اند که فرمول محاسبۀ آن‌ها به شرح روابط زیر است:
(14)     
(15)     
(16)     
(17)     

مطابق روابط (16-14)، TP مثبت حقیقی، TN منفی حقیقی، FP مثبت کاذب و FN نشان‌دهندۀ منفی کاذب نمونه‌ها در کلاس‌های طبقه‌بندی است. رابطۀ (17) نیز نحوۀ محاسبۀ کاپا کوهن را نمایش می‌دهد. این ضریب یک شاخص محاسبۀ آماری است که در آن  بیانگر قرارداد نسبی مشاهده‌شده بین ارزیاب‌ها است و   احتمال فرضی قرارداد شانس را نمایش می‌دهد.
شکل (7) صحت و خطای تاس  روش پیشنهادی را برای تقسیم‌بندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک نشان می‌دهد. مطابق همین شکل، همان‌طور که مشاهده می‌شود، 150 تکرار برای آموزش و ارزیابی شبکه در نظر گرفته شده‏اند که با افزایش تعداد تکرارها، صحت افزایش و خطا کاهش می‌یابد. بر اساس همین شکل، صحت شبکه در نهایت برای مجموعۀ آزمون به 83 درصد می‌رسد. شکل (8) نمونه‌های اصلی تصاویر CT، ماسک باینری و تصویر پیش‌بینی‌شده از شبکۀ آموزش‏دیده را برای بخش‏بندی خودکار سکتۀ مغزی ایسکمیک به‏ترتیب از چپ به راست نمایش می‌دهد. ارزیابی مدل پیشنهادی از لحاظ معیارهای صحت، ضریب تشابه تاس، حساسیت، شاخص جاکارد و کاپا کوهن در جدول (3) ارائه شده است. مطابق این جدول، همان‌طور که مشخص است، معیارهای ارزیابی عملکرد مطلوب شبکۀ پیشنهادی را تأیید می‏کنند. به ‌علاوه، شاخص آماری کاپا کوهن در محدودۀ 82/0 است که نشانگر کارایی مطلوب مدل عمیق پیشنهادی است. به‌ منظور ارزیابی مدل پیشنهادی، تجزیه ‌و تحلیل منحنی مشخصه (ROC)  در شبکۀ پیشنهادی انجام شد. نتایج این تجزیه‌ و تحلیل در شکل (9) نشان داده شده است. همان‌طور که مشخص است، نمودار به‌دست‌آمده برای تقسیم‌بندی در محدودۀ 7/0 تا 9/0 قرار دارد که اثربخشی بهینه شبکۀ پیشنهادی را نمایش می‌دهد. شکل (10) خوشه‌بندی تصاویر CT را با در نظر گرفتن تعدادی متفاوت از مناطق نشان می‌دهد. برای مقایسۀ بصری، خوشه‌بندی بر اساس 25، 50، 100 و 150 ناحیه به ‌طور جداگانه نشان داده شده است. با در نظر گرفتن مصالحه بین نواحی الگوریتم خوشه‌بندی تکراری خطی ساده و صحت تقسیم‌بندی، تعداد 150 ناحیه برای به دست آوردن نمودار مربوط انتخاب شد. جزئیات پارامترهای ارزیابی در جدول (4) نشان داده شده‏ است که به این سه منطقۀ مختلف مربوط می‏شود. انتخاب 100 ناحیه بهترین اثربخشی را از نظر معیارهای صحت، ضریب تشابه تاس و شاخص جاکارد تأیید می‌کند.
به منظور تعیین اثربخشی بهتر مدل پیشنهادی برای تقسیم‌بندی سکتۀ مغزی ایسکمیک، مدل پیشنهادی با شبکه‌های Modified U-Net و Shortcut CNN مقایسه شد [24]. این دو شبکۀ مقایسه‌شده به ‌طور گسترده در مطالعه‏های گذشته در رابطه با تقسیم‌بندی سکتۀ مغزی ایسکمیک استفاده شده‏اند. نتایج عملکرد از نظر صحت شکل (11) نشان داده شده است. مطابق شکل (11)، همان‌طور که مشاهده می‌شود، شبکۀ پیشنهادی توانسته است بیشترین صحت را برای تقسیم‌بندی سکتۀ مغزی ایسکمیک به دست آورد. همچنین، همان‌طور که نشان داده شده است، نرخ نوسان مدل پیشنهادی بسیار کمتر از دو شبکۀ مقایسه‏شده است که به معماری سفارشی‌شده بر اساس شبکۀ پیشنهادی مربوط است.
ما اثربخشی روش پیشنهادی خود را با مطالعه‏های گذشته مقایسه کرده‌ایم. نتایج به‌دست‌آمده در جدول (5) ارائه شده است. بر اساس نتایج به‌دست‌آمده، DSC روش پیشنهادی برای تقسیم‌بندی خودکار سکتۀ مغزی ایسکمیک 41/75 درصد است؛ در حالی ‌که همین شاخص برای مطالعه‏های [18] و [17] به‏ترتیب 68 و 42 درصد است.
 

 
 
شکل (7): الف. صحت و ب. خطای شبکۀ پیشنهادی در 150 تکرار

           
           
شکل (8): مقایسۀ الف. تصویر CT، ب. ماسک متناظر و پ. عملکرد مدل پیشنهادی در تشخیص سکتۀ مغزی ایسکمیک

جدول (3): عملکرد شبکۀ پیشنهادی بر اساس شاخص‌های ارزیابی مختلف
شاخص اندازه‌گیری    عملکرد (%)
صحت    1/83
ضریب تشابه تاس    41/75
ضریب جاکارد    52/74
حساسیت    78
دقت    89/80
کاپا کوهن    82/0

 
شکل (9): تجزیه‌ و تحلیل منحنی ROC
الف. 
ب. 
پ. 
ت. 
شکل (10): نواحی انتخابی با الگوریتم خوشه‌بندی تکراری ساده
الف. 25 ناحیۀ انتخابی، ب. 50 ناحیۀ انتخابی، پ. 100 ناحیۀ انتخابی و ت. 150 ناحیۀ انتخابی

جدول (4): نتایج حاصل‌ بر اساس تعداد نواحی انتخاب‌شدۀ مختلف
شاخص اندازه‌گیری    تعداد ناحیۀ انتخابی با الگوریتم خوشه‌بندی تکراری ساده
    25    50    100    150
صحت    27/72    74/79    1/83    85/82
DSC    94/64    67/91    41/75    25/71
ضریب جاکارد    25/62    01/70    52/74    42/72
دقت    87/68    25/75    89/80    92/78
جدول (5): مقایسۀ مدل پیشنهادی با پژوهش‌های گذشته
مطالعه    روش استفاده‌شده    DSC (%)
ونگ و همکاران [14]
Multi-scale U-Net    55
کلیجیوس و همکاران [15]
FCN    57
غنمات و همکاران [16]
Mutation Model    22/43
راجو و همکاران [17]
U-Net with Group Convolutions    42
سلطان پور و همکاران [18]
MultiRes U-Net    1/68
روش پیشنهادی    Graph Convolution    41/75

 
شکل (11): عملکرد شبکۀ پیشنهادی در حضور سایر شبکه‌های مورد مقایسه

جدول (6): پیچیدگی محاسباتی مدل پیشنهادی در مقایسه با سایر شبکه‌های مورد مقایسه
روش    زمان آموزش (ثانیه)    زمان آزمون (ثانیه)
Modified U-Net    2201    4
Shortcut CNN    2705    7
مدل پیشنهادی    3208    9

 
طبق این جدول، همان‌طور که نشان داده شده است، روش پیشنهادی بر اساس مستندات ارائه‌شده در نمودارها و منحنی‌های قبلی برای اولین بار در پژوهش حاضر به صحت بیشتر از 80 درصد برای تقسیم‌بندی سکتۀ مغزی ایسکمیک دست یافته است. پیچیدگی محاسباتی الگوریتم پیشنهادی با شبکه‌های مورد مقایسۀ Modified U-Net وShortcut CNN در جدول (6) ارائه شده است. همان‌طور که مشخص است، روش پیشنهادی زمان آموزش بیشتری نسبت به شبکه‌های مقایسه‌شده دارد که این مشکل را با ظهور واحد‌های گرافیکی قدرتمند می‏توان برطرف کرد. همچنین، همان‌طور که مشخص است، زمان آزمون بر اساس مدل پیشنهادی حدود 9 ثانیه است که از سایر روش‌های مورد مقایسه، با در نظر گرفتن صحت بیشتر، برتری دارد و می‌توان از آن در کاربردهای بلادرنگ هم استفاده کرد.
همان‌طور که می‌دانیم، تصاویر  CTPبه‌شدت به حرکت بیمار وابسته هستند و در صورت حرکت جزئی بیمار، خروجی تصویر  CTPنویزدار خواهد بود و پزشک معالج در تشخیص محل، اندازه و شدت ضایعه با مشکل روبه‏رو خواهد بود. متأسفانه، هیچ ‌یک از مطالعه‏های گذشته به دلیل کاهش عملکرد الگوریتم، مدل پیشنهادی خود را در محیط‌های نویزی ارزیابی نکرده‏اند. همان‌طور که مشخص است، برای راه‌یابی پژوهش حاضر به حوزۀ کاربردی درمانی، لازم است تا مدل پیشنهادی در مقابل عدم قطعیت‌های مختلف همچون نویز آزمایش و ارزیابی شود. به این ترتیب، برای شبیه‌سازی نویزهای حرکتی بیمار، نویز سفید گاوسی به تصاویر در طیفی مختلف از سیگنال-به-نویز (SNR)  مختلف افزوده شد. نویز اضافه‌شده به تصاویر در طیفی مختلف از SNRهای مختلف در شکل (12) نمایش داده شده است. همچنین، نتایج بخش‌بندی بر اساس مدل پیشنهادی و شبکه‌های قابل ‌مقایسۀ Modified U-Net و Shortcut CNN در شکل (13) ارائه شده است. مطابق همین شکل، همان‌طور که مشخص است، شبکۀ پیشنهادی به‌خوبی توانسته است در بازه‏ای وسیع از SNRهای مختلف، مقاومتی خوب را از خود به نمایش بگذارد.
این مطالعه همانند سایر مطالعه‏ها دارای مزایا و معایبی است. از جملۀ مزایایی این پژوهش می‌توان دست‏یابی به بهترین عملکرد بخش‌بندی را بیان کرد. همچنین، ارائۀ روش مطمئن بر اساس شبکه‌های کانولوشنال گراف ممکن است بستری بسیار مناسب برای طبقه‌بندی سکتۀ مغزی ایسکمیک باشد؛ با این‌ حال، ابعاد پایگاه دادۀ استفاده‏شده باید افزایش یابند. بر همین اساس، ما در مطالعه‏های آینده قصد داریم تا پایگاه داده‏ای جامع‌تر را برای تقسیم‌بندی خودکار سکتۀ مغزی ایسکمیک ارائه دهیم. با توجه به عملکرد مطلوب مدل پیشنهادی، می‌توان از آن در آینده برای کمک به پزشکان و رادیولوژیست‌ها در شناسایی ابعاد و محل دقیق ضایعۀ سکتۀ مغزی ایسکمیک استفاده کرد.
 
 
 
شکل (12): نویز اضافه‌شده به تصاویر در طیف SNRهای مختلف
 
شکل (13): نحوۀ عملکرد مدل پیشنهادی در محیط نویزی در حضور سایر شبکه‌های مورد مقایسه
 
5- نتیجه‌گیری
در این مطالعه، روشی جدید بر اساس شبکه‌های یادگیری عمیق به ‌منظور بخش‌بندی خودکار سکتۀ مغزی ایسکمیک با استفاده از تصاویر  CTPارائه شده است. به این منظور، معماری شبکۀ پیشنهادی از پنج لایۀ گراف کانولوشنال به همراه یک لایۀ سافت مکس تشکیل شده است که می‌تواند انتخاب/استخراج ویژگی و بخش‌بندی را به صورت خودکار انجام دهد. معماری پیشنهادی در این مطالعه با سایر روش‌های محبوب و مطالعه‏های مرتبط مقایسه قرار شده و عملکردی امیدوارکننده‌ را از خود به نمایش گذاشته است؛ به طوری که DSC روش پیشنهادی برای بخش‌بندی ضایعۀ سکتۀ مغزی ایسکمیک بر اساس پایگاه دادۀ ISLES 2018، بیشتر از 75 درصد گزارش شده است. با توجه به عملکرد مطلوب روش پیشنهادی، می‌توان از آن برای تشخیص خودکار ضایعۀ سکتۀ مغزی ایسکمیک بدون نیاز به تشخیص بصری استفاده کرد.

  1. Maier, C. Schröder, N. D. Forkert, T. Martinetz, H. Handels, "Classifiers for ischemic stroke lesion segmentation: a comparison study", PloS one, Vol. 10, No. 12, p. e0145118, 2015.

[2] R. Guerrero, O. Oktay, C. Bowles a, L. Chen a, R. Joules b, R. Wolz b a, M.C. Valdés-Hernández c, "White matter hyperintensity and stroke lesion segmentation and differentiation using convolutional neural networks", NeuroImage: Clinical, Vol. 10, pp. 978-934, 2019.

[3] S. Rekik, T. K. Allassonnière, J. M. Carpenter, Wardlaw, "Medical image analysis methods in MR/CT-imaged acute-subacute ischemic stroke lesion: Segmentation, prediction and insights into dynamic evolution simulation models. A critical appraisal", NeuroImage: Clinical, Vol. 1, No. 1, pp. 164-178, 2012.

[4] Y. Zhou, W. Huang, P. Dong, Y. Xia, S. Wang, "D-UNet: a dimension-fusion U shape network for chronic stroke lesion segmentation", IEEE/ACM transactions on computational biology and bioinformatics, Vol. 18, No. 3, pp. 940-950, 2019.

[5] Y. Wang, A. K. Katsaggelos, X. Wang, T. B. Parrish, "A deep symmetry convnet for stroke lesion segmentation", IEEE International Conference on Image Processing (ICIP), pp. 111-115, 2016.

[6] J. Mitra Pierrick Bourgeat, Jurgen Fripp, S. Ghose, S. Rose, O. Salvado, A. Connelly, B. Campbell; "Lesion segmentation from multimodal MRI using random forest following ischemic stroke", NeuroImage, Vol. 98, pp. 324-335, 2014.

[7] O. Maier, M. Wilms, J. von der Gablentz, U. M. Krämer, T. F. Münte, H. Handels, "Extra tree forests for sub-acute ischemic stroke lesion segmentation in MR sequences", Journal of neuroscience methods, Vol. 240, pp. 89-100, 2015.

[8] Y. Zhang, S. Liu, C. Li, J. Wang, "Application of deep learning method on ischemic stroke lesion segmentation", Journal of Shanghai Jiaotong University (Science), Vol. 27, No. 1, pp. 99-111, 2022.

[9] K. Qi, Hao Yang, Cheng Li, Zaiyi Liu, Meiyun Wang, Qiegen Liu and Shanshan Wang, "X-net: Brain stroke lesion segmentation based on depthwise separable convolution and long-range dependencies", International conference on medical image computing and computer-assisted intervention, pp. 247-255, Springer, 2019

[10] R. Guerrero, C. Qin, O. Oktay, C. Bowles, L. Chen, R. Joules, R. Wolz, M. C. Valdés-Hernández, "White matter hyperintensity and stroke lesion segmentation and differentiation using convolutional neural networks", NeuroImage: Clinical, Vol. 17, pp. 918-934, 2018.

[11] M. Soltanpour, R. Greiner, P. Boulanger, B. Buck, "Ischemic stroke lesion prediction in CT perfusion scans using multiple parallel u-nets following by a pixel-level classifier", IEEE 19th International Conference on Bioinformatics and Bioengineering (BIBE), pp. 957-963, 2019.

[12] P. Liu, "Stroke lesion segmentation with 2D novel CNN pipeline and novel loss function", International MICCAI Brainlesion Workshop, pp. 253-262: Springer, 2018.

[13] J. Dolz, I. Ben Ayed, C. Desrosiers, "Dense multi-path U-Net for ischemic stroke lesion segmentation in multiple image modalities", International MICCAI Brainlesion Workshop, pp. 271-282, Springer, 2018.

[14] G. Wang, T. Song, Q. Dong, M. Cui, N. Huang, S. Zhang, "Automatic ischemic stroke lesion segmentation from computed tomography perfusion images by image synthesis and attention-based deep neural networks", Medical Image Analysis, Vol. 65, p. 101787, 2020.

[15] A. Clèrigues, S. Valverde, J. Bernal, J. Freixenet, A. Oliver, X. Lladó, "Acute ischemic stroke lesion core segmentation in CT perfusion images using fully convolutional neural networks", Computers in Biology and Medicine, Vol. 115, p. 103487, 2019.

[16] R. Ghnemat, A. Khalil, and Q. Abu Al-Haija, "Ischemic stroke lesion segmentation using mutation model and generative adversarial network," Electronics, vol. 12, no. 3, p. 590, 2023.

[17] C. S. P. Raju, A. M. Kirupakaran, B. C. Neelapu, R. H. Laskar, "Ischemic Stroke Lesion Segmentation in CT Perfusion Images Using U-Net with Group Convolutions", International Conference on Computer Vision and Image Processing, pp. 276-288, Springer, 2022.

[18] M. Soltanpour, R. Greiner, P. Boulanger, B. Buck, "Improvement of automatic ischemic stroke lesion segmentation in CT perfusion maps using a learned deep neural network", Computers in Biology and Medicine, Vol. 137, p. 104849, 2021.

[19] Isles challenge 2018 ischemic stroke lesion segmentation. www.isles-challenge.org.

[20] M. Defferrard, X. Bresson, P. Vandergheynst, "Convolutional neural networks on graphs with fast localized spectral filtering", Advances in neural information processing systems, Vol. 29, 2016.

[21] A. Lazcano, P. J. Herrera, M. Monge, "A Combined Model Based on Recurrent Neural Networks and Graph Convolutional Networks for Financial Time Series Forecasting", Mathematics, Vol. 11, No. 1, p. 224, 2023.

[22] A. Fabijanska, "Graph Convolutional Networks for Semi-Supervised Image Segmentation", IEEE Access, Vol. 10, pp. 104144-104155, 2022.

[23] J. Zhang, Y. Zhang, Y. Jin, J. Xu, X. Xu, "MDU-Net: multi-scale densely connected U-Net for biomedical image segmentation", Health Information Science and Systems, Vol. 11, No. 1, p. 13, 2023.

[24] W. Weng, X. Zhu, L. Jing, M. Dong, "Attention Mechanism Trained with Small Datasets for Biomedical Image Segmentation", Electronics, Vol. 12, No. 3, p. 682, 2023.