Document Type : Research Article
Authors
1 Phd Student, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran
2 Associate Prof, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran
3 Assistant Professor, Department of Biomedical Engineering, Faculty of Electrical and Computer Engineering, University of Tabriz, Tabriz, Iran
Abstract
Keywords
Main Subjects
1- مقدمه
سکتۀ مغزی یکی از علل اصلی مرگومیر و ناتوانی در سراسر جهان است که سالانه 15 میلیون نفر را تحت تأثیر قرار میدهد [1]. از این تعداد، نیمی از کسانی که پس از سکتۀ مغزی زنده میمانند، دچار ناتوانی مزمن میشوند [2]. تقریباً 90 درصد سکتههای مغزی از نوع ایسکمیک هستند که توسط یک شریان مسدودشده ایجاد میشوند و به کاهش جریان خون در مغز، ایسکمی بافتی و آنفارکتوس منجر میشوند [3]. سکتۀ مغزی ناشی از نوع دوم به دلیل ترکیدگی یا پارگی یک رگ خونی ضعیفشده به وجود میآید [4]. مطابق گزارش سازمان غذا و دارو، 87 درصد از سکتههای مغزی در ایالاتمتحده از نوع ایسکمیک و 13 درصد از نوع هموراژیک هستند. از جملۀ پارامترهای مهم در عوامل عمدۀ سکته مغزی میتوان به سن، جنسیت، نژاد و قومیت اشاره کرد. همچنین، از عوامل بالینی میتوان به داشتن بیماری زمینهای از جمله فشارخون بالا، بیماریهای قلبی و دیابت اشاره کرد. علاوه بر این، برای پارامترهای سبک زندگی میتوان کمتحرکی، چاقی، تغذیۀ نامناسب، مصرف دخانیات و الکل را در نظر گرفت [5]. تشخیص سکتۀ مغزی شامل یک تاریخچۀ پزشکی دقیق، معاینۀ فیزیکی، عصبی و یک آزمایش تصویربرداری مغزی مانند اسکن CT یا تصویربرداری رزونانس مغناطیسی (MRI) است که به منظور رد سایر احتمالات در تشخیص از جمله تومورهای مغزی، انتخاب نوع روش جراحی و تجویز دارو به منظور حل کردن لختههای خونی انجام میشود [6].
تشخیص و بخشبندی خودکار ضایعههای سکتۀ مغزی ایسکمیک به صورت سنتی با بهکارگیری روش سنتی و استفاده از رادیولوژیست عصبی انجام میشود. در روش سنتی، رادیولوژیست عصبی به صورت بصری ناحیۀ آنفارکتوس یا سایه را شناسایی و پزشک متخصص را از نوع عروق لختهشده مطلع میکند [7]؛ با این حال، نوع ضایعهها با یکدیگر همسان نیستند و از لحاظ شکل ظاهری، اندازه و محل قرارگیری متفاوت هستند. به این ترتیب، تفسیر و تشخیص از تصاویر تصویربرداری مغزی فرآیندی پیچیده است و به دانش تخصصی نیاز دارد [8]. علاوه بر این، تفسیر سنتی ضایعههای سکتۀ مغزی توسط رادیولوژیست عصبی فرآیندی زمانبر، مستعد خطا و دارای دقت کم است [9]. همچنین، در صورت تشخیص اشتباه ممکن است پیامدهایی جبرانناپذیر را به همراه داشته باشد. به علاوه، ممکن است کنتراست تصاویر اخذشده کم باشد و رادیولوژیست عصبی به دلیل وجود نویز در تصاویر نتواند تشخیصی درست از ناحیۀ ضایعه و عروق گرفتهشده داشته باشد [10]. بهتازگی، پژوهشهایی بسیار در زمینۀ تشخیص خودکار سکتۀ مغزی ایسکمیک ارائه شدهاند که در ادامه، هر یک از آنها را بررسی خواهیم کرد.
سلطانپور و همکاران [11] از چهار شبکۀ U-Net دوبعدی به منظور تقسیمبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک استفاده کردهاند. در مرحلۀ پیشپردازش مدل این پژوهشگران، نواحی پرت حذف شدند و مجموعۀ داده با استفاده از چرخش، مقیاسبندی و اضافه کردن نویز تقویت شد. در مرحلۀ بعد، شبکههای U-Net موازی توسط نقشههای پرفیوژن توموگرافی کامپیوتری (CTP) آموزش داده شدند. عملکرد تقسیمبندی مدل این پژوهشگران با استفاده از معیارهای ضریب تشابه تاس (DSC) و شباهت حجمی ارزیابی شد و از مجموعۀ دادههای چالش ISLES 2018 به منظور استفاده در مجموعۀ آموزش و ارزیابی شبکه استفاده شد. لیو و همکاران [12] از تصاویر CTP به منظور بخشبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک استفاده کردند. این پژوهشگران در مدل پیشنهادی خود از شبکههای مولد تخاصمی (GANs) به منظور تولید تصویربرداری بر وزن انتشار (DWI) استفاده کردند. به طور کلی، ساختار شبکۀ کانولوشنال این پژوهشگران شامل یک مولد، یک تفکیککننده و یک تقسیمکننده است. DSC این پژوهشگران بر اساس اعتبارسنجی 4-برابری 49 درصد گزارش شده است. دولز و همکاران [13] به منظور تقسیمبندی ضایعات سکتۀ مغزی ایسکمیک از شبکههای U-Net اصلاحشده استفاده کردند. معماری این پژوهشگران از سه جنبۀ مختلف دارای اهمیت بود. اول اینکه، بهجای ترکیب مودالیتههای تصویر موجود در یک ورودی، هر یک از آنها در مسیری متفاوت پردازش شدهاند تا از اطلاعات منحصربهفرد با عملکردی بهتر بهرهبرداری شود. دوم اینکه، شبکۀ پیشنهادی این پژوهشگران به طور متراکم متصل بود (هر لایه به تمام لایههای بعدی متصل است). سوم اینکه، این پژوهشگران با الهام از مدل شبکۀ Inception، ماژولهای استاندارد U-Net را با دو بلوک کانولوشن پیچشی در لایههای ورودی به منظور عملکرد بهتر در مقیاسهای متفاوت بهبود دادهاند. نتایج این پژوهش نشان داد اطلاعات چندوجهی میتوانند در مقایسه با راهبردهای سادهتر، عملکردی بهتر را از خود به نمایش بگذارند. ونگ و همکاران [14] چارچوبی جدید مبتنی بر DWI از نقشههای CTP را برای به دست آوردن کیفیت بهتر به منظور تقسیمبندی دقیقتر ضایعههای مغزی ارائه کردند. مدل پیشنهادی این پژوهشگران شامل سه مؤلفۀ مبتنی بر شبکههای عصبی کانولوشنال (CNN) بود که به صورت سرتاسر و پایان به پایان آموزش داده میشد. این پژوهشگران در مسابقۀ چالش تصاویر ISLES 2018 رتبۀ اول را به دست آوردند. آلبرت و همکاران [15] با استفاده از تصاویر CTP و CT، سکتۀ مغزی ایسکمیک را به طور خودکار بخشبندی کردهاند. به این منظور، این پژوهشگران از مجموعۀ دادۀ چالشی ISLES استفاده کردهاند. همچنین، آنها به منظور بخشبندی تصاویر از یک شبکۀ U-Net بهبودیافته استفاده کردند. مجموعۀ ارزیابی نمونهها شامل 94 تصویر ضایعه برای آموزش شبکه و 62 تصویر برای بخش آزمون شبکه بود. نحوۀ ارزیابی شبکۀ پیشنهادی آنها بر اساس روش 10-برابری انجام شده است و در نهایت، DSC حاصلشده برابر 49 درصد به منظور بخشبندی تصاویر توسط این پژوهشگران گزارش شده است. میتوان دقت کم در تشخیص ضایعات را از جملۀ معایب این پژوهش در نظر گرفت. غنمات و همکاران [16] مدلی جدید را بر اساس رویکردهای یادگیری عمیق به منظور بخشبندی ضایعۀ سکتۀ مغزی ایسکمیک ارائه کردند. این پژوهشگران در این کار از فاصلۀ اقلیدسی برای محاسبۀ میانگین فاصلۀ هر پیکسل در جهت راست و پایین استفاده کردند. آنها توانستند ضریب تشابه تاس را نسبت به پژوهشهای اخیر 5/2 درصد بهبود ببخشند. راجو و همکاران [17] از شبکههای U-Net به منظور بخشبندی و تشخیص خودکار سکتۀ مغزی ایسکمیک استفاده کردهاند. آنها یک مدل عمیق مشتقشده از U-Net را در پژوهش خود ارائه دادهاند که میتوانست تمامی نقشههای CTP را به طور موازی و مستقل پردازش کند. ضریب تشابه تاس گزارششده توسط این پژوهشگران حدود 42 درصد بود. سلطانپور و همکاران [18] یک شبکۀ عصبی عمیق را به منظور بخشبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک ارائه کردند. به این منظور، در این پژوهش، از معماری اصلاحشدۀ شبکۀ U-Net استفاده شد. در داخل این شبکه، از CNNهای چندمقیاسی و اتصالات میانبر مبتنی بر CNN استفاده شده بود. نتیجۀ نهایی گزارششده توسط آنها دارای شاخص تشابه تاس 68 درصد بود.
مطابق بررسیهای پژوهشهای پیشین، هر کدام از این مطالعهها دارای مزایا و معایبی بوده است؛ با این حال، مشکل اساسی در بخشبندی خودکار ضایعات سکتۀ مغزی، DSC کمتر از 68 درصد است. علاوه بر این، تقریباً تمامی شبکههای پیشین بازدهی عملیاتی در محیطهای نویزی را ندارند که این امر استفاده از الگوریتم پیشنهادی پژوهشگران را در کاربردهای بلادرنگ در حضور عدم قطعیتهای مختلف همچون نویز به منظور بخشبندی تصاویر زیر سؤال میبرد. روش پیشنهادی این پژوهش مبتنی بر شبکههای گراف کانولوشنال عمیق است که در نظر دارد از چالشهای مربوط گذر کند تا بتوان از آن در کاربرد عملی به عنوان دستیار پزشکی برای بخشبندی خودکار سکتۀ مغزی ایسکمیک استفاده کرد. نوآوری مطالعۀ حاضر را میتوان در موارد زیر جستوجو کرد:
الف) ارائۀ مدلی خودکار و پایان به پایان بر اساس ترکیب نظریۀ گراف و شبکههای کانولوشنال عمیق بدون نیاز به بلوک دیاگرام انتخاب/استخراج ویژگی.
ب) دستیابی به بیشترین مقادیر صحت و DSC در مقایسه با پژوهشهای گذشته به منظور بخشبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک با استفاده از تصاویر پرفیوژن CT.
پ) ارائۀ مدلی خودکار با قابلیت مقاومت زیاد در مقابل نویزهای محیطی تا محدودۀ SNR=-4 dB.
ادامۀ مقاله به صورت زیر سازمان یافته است: بخش دوم پایگاه دادۀ استفادهشده را به همراه نظریۀ ریاضی شبکههای گراف کانولوشنال بررسی میکند. بخش سوم روش پیشنهادی پژوهش حاضر را ارائه میدهد. بخش چهارم نتایج شبیهسازی را بر اساس روش پیشنهادی ارائهشده مشخص میکند و در نهایت، بخش پنجم مربوط به نتیجهگیری است.
2- مواد و روشها
در این بخش، ابتدا پایگاه دادۀ مربوط به نقشههای سکتۀ مغزی ایسکمیک شرح داده میشود. سپس، پیشزمینۀ ریاضی مربوط به شبکههای گراف کانولوشنال بررسی خواهد شد.
2-1- پایگاه دادۀ ISLES 2018
پایگاه دادۀ ISLES 2018 به عنوان جامعترین مجموعۀ داده به منظور بخشبندی خودکار سکتۀ مغزی ایسکمیک شناخته میشود. میتوان بقیۀ پایگاههای دادۀ عمومی موجود را مشتقی از این مجموعۀ داده در نظر گرفت. این پایگاه داده شامل مجموعۀ دادههای مربوط به 103 بیمار است که با هدف تقسیمبندی هستۀ ضایعۀ سکتۀ مغزی از تصاویر CTP اخذ شده است. همچنین، این مجموعۀ داده شامل اسکنهایCTP چهاربعدی، نقشههای CTP سهبعدی شامل MTT، CBF، CBV و Tmax است. نمونهای از این نقشهها در شکل (1) نمایش داده شده است. در این پایگاه، هر بیمار در عرض 3 ساعت از تصویربرداری CTP پایه، تحت DW-MRI قرار گرفته است تا اعتبارسنجی توسط متخصص رادیولوژی انجام شود. تصاویر به صورت قطعهقطعه با تعداد برش محوری متغیر، از 2 تا 22 قطعه بسته به بیمار، با فاصلۀ 5 میلیمتری و وضوح 256×256 اخذ شدهاند [19].
شکل (1): نقشههای CTP به همراه تصویر طرف مقابل آنها در پایگاه داده ISLES 2018 [44].
2-2- شبکۀ کانولوشنال گراف
ایدۀ اولیۀ شبکۀ کانولوشنال گراف برای اولین بار توسط مایکل دفرارد و همکاران در سال 2016 مطرح شد [20]. این پژوهشگران برای اولین بار از پردازش سیگنال در حوزۀ گراف و نظریۀ طیفی گراف در تعریف تابع کانولوشنی استفاده کردهاند که این موضوع امکان استفاده از شبکههای کانولوشنی را در قالب نظریۀ گراف فراهم میکند.
در نظریۀ گراف، داشتن ماتریس درجه و ماتریس مجاورت دارای اهمیتی ویژه است. اتصال هر یک از رأسها در گراف با استفاده از ماتریس مجاورت حاصل میشود. همچنین، با داشتن ماتریس مجاورت، میتوان ماتریس درجه را نیز به دست آورد. این ماتریس، ماتریس قطری است که درایههای قطر آن با مجموع لبههای متصل به رأس متناظر با درایه برابر هستند. ماتریس درجه به صورت و ماتریس گراف به صورت نمایش داده میشود و iامین عنصر قطری ماتریس درجه به صورت زیر تعریف میشود [21]:
(1)
ماتریس لاپلاسین نیز به صورت رابطۀ زیر تعریف میشود:
(2)
مطابق رابطۀ بالا، همانطور که مشخص است، حاصل تفریق دو ماتریس درجه و ماتریس مجاورت ماتریس لاپلاسین را شکل میدهد. از این ماتریس به منظور محاسبۀ توابع پایۀ گراف استفاده میشود. توابع پایۀ گراف را میتوان با استفاده از تجزیه به مقادیر تکین (SVD) در ماتریس لاپلاسین به دست آورد. همچنین، ماتریس لاپلاسین را میتوان با در نظر گرفتن ماتریس بردارهای ویژه و ماتریس مقادیر تکین به فرم رابطۀ (2) تعریف کرد. بر اساس رابطۀ (2)، ستونهای ماتریس بردارهای ویژه با بردارهای ویژۀ ماتریس لاپلاسین متناظر هستند. تبدیل فوریه نیز بر اساس همین بردارهای ویژه امکانپذیر است و پایههای فوریه با داشتن مقادیر ویژۀ قطری شامل به صورت رابطۀ زیر تعریف میشوند:
(3)
برای درک بهتر، تبدیل فوریه و عکس تبدیل فوریۀ یک سیگنال مانند بهترتیب در روابط (4) و (5) تعریف میشوند:
(4)
(5)
بر اساس رابطۀ (4)، نمایشدهندۀ تبدیل فوریۀ گراف است. همچنین، بر اساس رابطۀ (5)، بردار ویژگی برای سیگنالی همچون q با داشتن پایههای فوریه و تبدیل فوریۀ گراف امکانپذیر است.
عملگر کانولوشن گراف نیز با داشتن کانولوشن دو سیگنال در حوزۀ گراف توسط تبدیل فوریۀ هر سیگنال محاسبه میشود. برای درک بهتر، کانولوشن دو سیگنال z و y به همراه اپراتور به صورت رابطۀ زیر تعریف میشود:
(6)
در رابطۀ بالا، از تابع فیلترکنندۀ برای توصیف یک عملگر کانولوشن گراف در ترکیب با شبکههای عصبی استفاده شده است. بر اساس رابطۀ بالا، z ورژن فیلترشده توسط است:
(7)
با جایگذاری ماتریس لاپلاسین و تجزیه به مقادیر تکین و بردارهای ویژه، کانولوشن گراف به صورت زیر تعریف میشود [22]:
(8)
2-3- الگوریتم خوشهبندی تکراری ساده
تصویر ورودی I با استفاده از تکنیک سوپرپیکسل الگوریتم خوشهبندی تکراری ساده (SLIC) برای تولید نمودار مجاورت منطقۀ G به چندین بخش مجزا تقسیم شد [23]. ، تعداد مناطق ارائهدهنده، به صورت تصادفی انتخاب شد که P×Q در اینجا خلاصهشدۀ وضوح فضایی است. با تقسیم هر کانال بر که در آن B عمق بیت هر کانال را نشان میدهد [23] و مطابق آن ویژگیهای تصویر در محدودۀ [0 و 1] نرمال میشوند، سوپرپیکسلهای Ri با رئوس vi در شبکۀ مجاورت منطقه حاصل مشخص میشوند که هر کدام با یک بردار ویژگی یکبعدی fi مشخص میشود که از ناحیۀ مربوطه به دست آمده است. میانگین شدت برای منطقۀ Ri با میانگین شدت پیکسل در نظر گرفته شد. لبههای وزندار گرههایی را به یکدیگر مرتبط میکنند که نواحی مجاور را نشان میدادند. فرمول زیر یک تابع وزندهی گاوسی را نشان میدهد که وزنها به واسطۀ آن به دست میآیند:
(9)
که در آن:
(10)
و β در اینجا یک پارامتر آزاد است.
یک ماتریس مجاورت ناحیه ، A = [aij] ∈ RN×N، مطابق رابطۀ زیر است:
(11)
پهمچنین، یک ماتریس ویژگی ناحیه X ∈ RN×1 وجود دارد که نشاندهندۀ N رأس است که هر کدام دارای ویژگیهایی در R1×1 است.
3- روش پیشنهادی
روش پیشنهادی در این مقاله در این بخش ارائه خواهد شد. ساختار اصلی مدل پیشنهادی در شکل (2) نمایش داده شده است.
3-1- پیشپردازش دادهها
ابتدا، عملیات پیشپردازش برای هر تصویر با در نظر گرفتن واحد ضریب هانسفیلد انجام و شدت پیکسلهای بیشتر از 150 و زیر صفر حذف و با صفر جایگزین میشود. سپس، اندازۀ تصاویر 256 256 با تمرکز بر بخش یادشده در نظر گرفته میشود. سپس، به منظور جلوگیری از پدیدۀ بیشبرازش، عملیات افزایش دادگان بر روی تصاویر انجام شد. به این منظور، تصاویر 0-20 درجه به چپ - راست و راست - چپ چرخانده شدند.
3-2- نحوۀ تشکیل گراف
نمایش گراف از طریق روش خوشهبندی تکراری خطی ساده به دست میآید. این رویکرد تصاویر را خوشهبندی میکند و دنبالهای از سوپرپیکسلها را به عنوان مناطق مختلف تصویر استخراج میکند. شکل (3) نحوۀ ایجاد یک گراف را با استفاده از این رویکرد نشان میدهد. شکل (3) نشان میدهد هر گره از این شبکه با ناحیههای سوپرپیکسلی بازیابیشده با استفاده از روش خوشهبندی تکراری خطی ساده مطابقت دارد. علاوه بر این، میانگین شدت پیکسلها در هر منطقه به عنوان بردار ویژگی مربوط به هر ناحیه و گره شبکه در نظر گرفته میشود. علاوه بر این، لبههای نمودار بسته به فاصله و همسایگی هر ناحیه
شکل (2): بلوک دیاگرام مدل عمیق پیشنهادی به منظور طبقهبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک
شکل (3): نحوۀ تشکیل گراف از تصاویر CT
شکل (4): شمای گرافیکی از معماری شبکۀ پیشنهادشده
در حین ایجاد یک ماتریس مجاورت گراف بررسی میشوند. در تشکیل گراف، مکانهای همسایه به هم مرتبط هستند؛ اما مناطق غیرهمسایه به هم مرتبط نیستند.
3-3- معماری شبکۀ عمیق پیشنهادی
معماری شبکۀ پیشنهادی در شکل (4) نمایش داده شده است. مطابق این شکل، مدل پیشنهادی به صورت زیر سازمان یافته است: الف) یک لایۀ کانولوشن روی یک گراف چبیشف به همراه نرمالساز دستهای ، تابع فعالسازی لیکی-رلو و فیلتر کردن دستهای ؛ ب) معماری مرحلۀ قبل چهار دفعۀ دیگر تکرار میشود؛ پ) یک لایۀ حذف تصادفی به منظور جلوگیری از پدیدۀ بیشبرازش و ت) امتیازها در لایه تماماً متصل با استفاده از تابع سافت مکس محاسبه میشوند. تفاوت در لایههای مختلف در شکل (5) نمایش داده شده است. هر گره در گراف ساختهشده دارای یک نمونه است؛ زیرا بردار ویژگی هر گره میانگین شدت پیکسل در هر ناحیه در نظر گرفته میشود. مستقل از گرههای شبکه، ابعاد ورودی لایۀ کانولوشن گراف در معماری پیشنهادی 16 پیکسل است. بعد خروجی لایه اول نیز برابر 16 است که بر اساس آن، گراف در نظر گرفتهشده دارای رئوس A و 16 نمونه در هر گره است.
مطابق شکل (5)، گرافهای ایجادشده از مرحلۀ قبل به عنوان ورودی مرحلۀ رمزگذار ویژگی استفاده میشوند و با گره A نمایش داده شدهاند. لایۀ کانولوشن گراف دوم یک گراف A-node با 16 نمونه را در هر رأس ایجاد میکند. عملیات یادشده تا زمانی ادامه مییابد که گراف پنجم یک گراف A-node با ابعاد 2 را ایجاد کند. سپس، خروجی استخراجشده از مرحلۀ رمزگذاری ویژگی به یک لایۀ حذف تصادفی فرستاده میشود و گراف A-node حاصل با دو نمونه در هر گره مسطح میشود تا بردار عناصر A ایجاد شود. پس از مسطح شدن، بردار وارد یک لایۀ سافت مکس میشود. همچنین، شکل (5) نشان میدهد که ترتیب
جدول (1): جزئیات لایههای مختلف در معماری پیشنهادی
Layer Shape of Weight Tensor Shape of Bias Number of Parameters
First graph convolution (O1, 16, 16) 16 256 × O1 + 16
Batch normalization (16) 16 32
Second graph convolution ([O2, 16, 16) 16 256 × O2 + 16
Batch normalization ([16) 16 32
Third graph convolution (O3, 16, 16) 16 256 × O3 + 16
Batch normalization (16) 16 32
Fourth graph convolution (O4, 16, 16) 16 256 × O4 + 16
Batch normalization (16) 16 32
Fifth graph convolution (O5, 16, 2) 2 32 × O4 + 2
Batch normalization (16) 16 32
Softmax layer - 2 2 × A × O4
شکل (5): معماری شبکۀ عمیق پیشنهادی به همراه جزئیات لایهها
جدول (2): پارامترهای بهینۀ انتخابشده در معماری شبکۀ پیشنهادی
پارامتر فضای جستوجو مقدار بهینه
بهینهساز RMSProp, Adam, Sgd, Adamax, Adadelta Adadelta
تابع خطا MSE, Cross Entropy Cross Entropy
تعداد لایههای گراف کانولوشنال 3 5 7 10 5
اندازۀ خروجی در لایۀ اول 16 32 64 128 16
اندازۀ خروجی در لایۀ دوم 16 32 64 128 16
اندازۀ خروجی در لایۀ سوم 16 32 64 128 16
اندازۀ خروجی در لایۀ چهارم 16 32 64 128 16
اندازۀ بهینه ساز 4-10×6 5-10×6 4-10×6
مقدار لایۀ حذف تصادفی 0 2/0 3/0 4/0 5/0 3/0
نرخ آموزش 01/0 001/0 0001/0 0001/0
هر لایۀ کانولوشنال گراف از بسط چندجملهای چبیشف منحصربهفرد است و توسط ضرایب O1، O2، O3 و O4 برای پنج لایۀ کانولوشنال گراف مشخصشده تعیین میشود. مشخصات شبکۀ پیشنهادی به همراه جزئیات لایهها در جدول (1) نمایش داده شده است.
3-4- مجموعۀ آموزش، ارزیابی و آزمون
شبکۀ پیشنهادی در این مطالعه با استفاده از رویکرد آزمون و خطا بر اساس اعتبارسنجی متقاطع 10برابری آموزش داده شده و ارزیابی شده است. شکل (6) نحوۀ تخصیص دادگان را به صورت سادهتر نمایش میدهد. مطابق این شکل، کل دادهها (100 درصد) به 10 بازۀ مساوی (10 درصد) تقسیم میشوند. در مرحلۀ اول، بازۀ 1 تا 9 به عنوان مجموعۀ آموزش انتخاب و بازۀ باقیمانده به عنوان مجموعۀ آزمون استفاده میشود. این تکنیک با شیفت یکبازهای تا 9 مرحله ادامه مییابد. بر اساس این روش، همۀ نمونهها در ارزیابی شرکت میکنند و پدیدۀ بیشبرازش در فرآیند آموزش رخ نمیدهد.
جدول (2) پارامترهای بهینۀ انتخابشده برای طراحی معماری پیشنهادی را نشان میدهد. همانطور که از این جدول مشخص است، از تعداد لایههای مختلف، الگوریتمهای بهینهسازی مختلف و غیره استفاده و بهترین مقدار برای معماری پیشنهادی انتخاب شده است.
شکل (6): نحوۀ تخصیص دادگان برای مجموعۀ آموزش و آزمون
4- یافتهها
نتایج مربوط به روش پیشنهادی در این بخش ارائه شده است.
کلیۀ شبیهسازیها در این مطالعه با استفاده از پلتفرم کلاب انجام شدهاند که مشخصات آن به شرح زیر است: رم 25 گیگابایت و Tesla k90 GPU. نتایج تقسیمبندی با استفاده از معیارهای ضریب تشابه تاس و شاخص جاکارد ارزیابی شد. روابط معیارهای در نظر گرفتهشده به صورت زیر هستند:
(12)
(13)
که در آنها S و T بهترتیب نتیجۀ تقسیمبندی و حقیقت عینی را نمایش میدهند. همچنین، معیارهایی دیگر از جمله صحت، دقت، حساسیت و کاپا کوهن در این پژوهش برای ارزیابی مدل پیشنهادی استفاده شدهاند که فرمول محاسبۀ آنها به شرح روابط زیر است:
(14)
(15)
(16)
(17)
مطابق روابط (16-14)، TP مثبت حقیقی، TN منفی حقیقی، FP مثبت کاذب و FN نشاندهندۀ منفی کاذب نمونهها در کلاسهای طبقهبندی است. رابطۀ (17) نیز نحوۀ محاسبۀ کاپا کوهن را نمایش میدهد. این ضریب یک شاخص محاسبۀ آماری است که در آن بیانگر قرارداد نسبی مشاهدهشده بین ارزیابها است و احتمال فرضی قرارداد شانس را نمایش میدهد.
شکل (7) صحت و خطای تاس روش پیشنهادی را برای تقسیمبندی خودکار ضایعۀ سکتۀ مغزی ایسکمیک نشان میدهد. مطابق همین شکل، همانطور که مشاهده میشود، 150 تکرار برای آموزش و ارزیابی شبکه در نظر گرفته شدهاند که با افزایش تعداد تکرارها، صحت افزایش و خطا کاهش مییابد. بر اساس همین شکل، صحت شبکه در نهایت برای مجموعۀ آزمون به 83 درصد میرسد. شکل (8) نمونههای اصلی تصاویر CT، ماسک باینری و تصویر پیشبینیشده از شبکۀ آموزشدیده را برای بخشبندی خودکار سکتۀ مغزی ایسکمیک بهترتیب از چپ به راست نمایش میدهد. ارزیابی مدل پیشنهادی از لحاظ معیارهای صحت، ضریب تشابه تاس، حساسیت، شاخص جاکارد و کاپا کوهن در جدول (3) ارائه شده است. مطابق این جدول، همانطور که مشخص است، معیارهای ارزیابی عملکرد مطلوب شبکۀ پیشنهادی را تأیید میکنند. به علاوه، شاخص آماری کاپا کوهن در محدودۀ 82/0 است که نشانگر کارایی مطلوب مدل عمیق پیشنهادی است. به منظور ارزیابی مدل پیشنهادی، تجزیه و تحلیل منحنی مشخصه (ROC) در شبکۀ پیشنهادی انجام شد. نتایج این تجزیه و تحلیل در شکل (9) نشان داده شده است. همانطور که مشخص است، نمودار بهدستآمده برای تقسیمبندی در محدودۀ 7/0 تا 9/0 قرار دارد که اثربخشی بهینه شبکۀ پیشنهادی را نمایش میدهد. شکل (10) خوشهبندی تصاویر CT را با در نظر گرفتن تعدادی متفاوت از مناطق نشان میدهد. برای مقایسۀ بصری، خوشهبندی بر اساس 25، 50، 100 و 150 ناحیه به طور جداگانه نشان داده شده است. با در نظر گرفتن مصالحه بین نواحی الگوریتم خوشهبندی تکراری خطی ساده و صحت تقسیمبندی، تعداد 150 ناحیه برای به دست آوردن نمودار مربوط انتخاب شد. جزئیات پارامترهای ارزیابی در جدول (4) نشان داده شده است که به این سه منطقۀ مختلف مربوط میشود. انتخاب 100 ناحیه بهترین اثربخشی را از نظر معیارهای صحت، ضریب تشابه تاس و شاخص جاکارد تأیید میکند.
به منظور تعیین اثربخشی بهتر مدل پیشنهادی برای تقسیمبندی سکتۀ مغزی ایسکمیک، مدل پیشنهادی با شبکههای Modified U-Net و Shortcut CNN مقایسه شد [24]. این دو شبکۀ مقایسهشده به طور گسترده در مطالعههای گذشته در رابطه با تقسیمبندی سکتۀ مغزی ایسکمیک استفاده شدهاند. نتایج عملکرد از نظر صحت شکل (11) نشان داده شده است. مطابق شکل (11)، همانطور که مشاهده میشود، شبکۀ پیشنهادی توانسته است بیشترین صحت را برای تقسیمبندی سکتۀ مغزی ایسکمیک به دست آورد. همچنین، همانطور که نشان داده شده است، نرخ نوسان مدل پیشنهادی بسیار کمتر از دو شبکۀ مقایسهشده است که به معماری سفارشیشده بر اساس شبکۀ پیشنهادی مربوط است.
ما اثربخشی روش پیشنهادی خود را با مطالعههای گذشته مقایسه کردهایم. نتایج بهدستآمده در جدول (5) ارائه شده است. بر اساس نتایج بهدستآمده، DSC روش پیشنهادی برای تقسیمبندی خودکار سکتۀ مغزی ایسکمیک 41/75 درصد است؛ در حالی که همین شاخص برای مطالعههای [18] و [17] بهترتیب 68 و 42 درصد است.
شکل (7): الف. صحت و ب. خطای شبکۀ پیشنهادی در 150 تکرار
شکل (8): مقایسۀ الف. تصویر CT، ب. ماسک متناظر و پ. عملکرد مدل پیشنهادی در تشخیص سکتۀ مغزی ایسکمیک
جدول (3): عملکرد شبکۀ پیشنهادی بر اساس شاخصهای ارزیابی مختلف
شاخص اندازهگیری عملکرد (%)
صحت 1/83
ضریب تشابه تاس 41/75
ضریب جاکارد 52/74
حساسیت 78
دقت 89/80
کاپا کوهن 82/0
شکل (9): تجزیه و تحلیل منحنی ROC
الف.
ب.
پ.
ت.
شکل (10): نواحی انتخابی با الگوریتم خوشهبندی تکراری ساده
الف. 25 ناحیۀ انتخابی، ب. 50 ناحیۀ انتخابی، پ. 100 ناحیۀ انتخابی و ت. 150 ناحیۀ انتخابی
جدول (4): نتایج حاصل بر اساس تعداد نواحی انتخابشدۀ مختلف
شاخص اندازهگیری تعداد ناحیۀ انتخابی با الگوریتم خوشهبندی تکراری ساده
25 50 100 150
صحت 27/72 74/79 1/83 85/82
DSC 94/64 67/91 41/75 25/71
ضریب جاکارد 25/62 01/70 52/74 42/72
دقت 87/68 25/75 89/80 92/78
جدول (5): مقایسۀ مدل پیشنهادی با پژوهشهای گذشته
مطالعه روش استفادهشده DSC (%)
ونگ و همکاران [14]
Multi-scale U-Net 55
کلیجیوس و همکاران [15]
FCN 57
غنمات و همکاران [16]
Mutation Model 22/43
راجو و همکاران [17]
U-Net with Group Convolutions 42
سلطان پور و همکاران [18]
MultiRes U-Net 1/68
روش پیشنهادی Graph Convolution 41/75
شکل (11): عملکرد شبکۀ پیشنهادی در حضور سایر شبکههای مورد مقایسه
جدول (6): پیچیدگی محاسباتی مدل پیشنهادی در مقایسه با سایر شبکههای مورد مقایسه
روش زمان آموزش (ثانیه) زمان آزمون (ثانیه)
Modified U-Net 2201 4
Shortcut CNN 2705 7
مدل پیشنهادی 3208 9
طبق این جدول، همانطور که نشان داده شده است، روش پیشنهادی بر اساس مستندات ارائهشده در نمودارها و منحنیهای قبلی برای اولین بار در پژوهش حاضر به صحت بیشتر از 80 درصد برای تقسیمبندی سکتۀ مغزی ایسکمیک دست یافته است. پیچیدگی محاسباتی الگوریتم پیشنهادی با شبکههای مورد مقایسۀ Modified U-Net وShortcut CNN در جدول (6) ارائه شده است. همانطور که مشخص است، روش پیشنهادی زمان آموزش بیشتری نسبت به شبکههای مقایسهشده دارد که این مشکل را با ظهور واحدهای گرافیکی قدرتمند میتوان برطرف کرد. همچنین، همانطور که مشخص است، زمان آزمون بر اساس مدل پیشنهادی حدود 9 ثانیه است که از سایر روشهای مورد مقایسه، با در نظر گرفتن صحت بیشتر، برتری دارد و میتوان از آن در کاربردهای بلادرنگ هم استفاده کرد.
همانطور که میدانیم، تصاویر CTPبهشدت به حرکت بیمار وابسته هستند و در صورت حرکت جزئی بیمار، خروجی تصویر CTPنویزدار خواهد بود و پزشک معالج در تشخیص محل، اندازه و شدت ضایعه با مشکل روبهرو خواهد بود. متأسفانه، هیچ یک از مطالعههای گذشته به دلیل کاهش عملکرد الگوریتم، مدل پیشنهادی خود را در محیطهای نویزی ارزیابی نکردهاند. همانطور که مشخص است، برای راهیابی پژوهش حاضر به حوزۀ کاربردی درمانی، لازم است تا مدل پیشنهادی در مقابل عدم قطعیتهای مختلف همچون نویز آزمایش و ارزیابی شود. به این ترتیب، برای شبیهسازی نویزهای حرکتی بیمار، نویز سفید گاوسی به تصاویر در طیفی مختلف از سیگنال-به-نویز (SNR) مختلف افزوده شد. نویز اضافهشده به تصاویر در طیفی مختلف از SNRهای مختلف در شکل (12) نمایش داده شده است. همچنین، نتایج بخشبندی بر اساس مدل پیشنهادی و شبکههای قابل مقایسۀ Modified U-Net و Shortcut CNN در شکل (13) ارائه شده است. مطابق همین شکل، همانطور که مشخص است، شبکۀ پیشنهادی بهخوبی توانسته است در بازهای وسیع از SNRهای مختلف، مقاومتی خوب را از خود به نمایش بگذارد.
این مطالعه همانند سایر مطالعهها دارای مزایا و معایبی است. از جملۀ مزایایی این پژوهش میتوان دستیابی به بهترین عملکرد بخشبندی را بیان کرد. همچنین، ارائۀ روش مطمئن بر اساس شبکههای کانولوشنال گراف ممکن است بستری بسیار مناسب برای طبقهبندی سکتۀ مغزی ایسکمیک باشد؛ با این حال، ابعاد پایگاه دادۀ استفادهشده باید افزایش یابند. بر همین اساس، ما در مطالعههای آینده قصد داریم تا پایگاه دادهای جامعتر را برای تقسیمبندی خودکار سکتۀ مغزی ایسکمیک ارائه دهیم. با توجه به عملکرد مطلوب مدل پیشنهادی، میتوان از آن در آینده برای کمک به پزشکان و رادیولوژیستها در شناسایی ابعاد و محل دقیق ضایعۀ سکتۀ مغزی ایسکمیک استفاده کرد.
شکل (12): نویز اضافهشده به تصاویر در طیف SNRهای مختلف
شکل (13): نحوۀ عملکرد مدل پیشنهادی در محیط نویزی در حضور سایر شبکههای مورد مقایسه
5- نتیجهگیری
در این مطالعه، روشی جدید بر اساس شبکههای یادگیری عمیق به منظور بخشبندی خودکار سکتۀ مغزی ایسکمیک با استفاده از تصاویر CTPارائه شده است. به این منظور، معماری شبکۀ پیشنهادی از پنج لایۀ گراف کانولوشنال به همراه یک لایۀ سافت مکس تشکیل شده است که میتواند انتخاب/استخراج ویژگی و بخشبندی را به صورت خودکار انجام دهد. معماری پیشنهادی در این مطالعه با سایر روشهای محبوب و مطالعههای مرتبط مقایسه قرار شده و عملکردی امیدوارکننده را از خود به نمایش گذاشته است؛ به طوری که DSC روش پیشنهادی برای بخشبندی ضایعۀ سکتۀ مغزی ایسکمیک بر اساس پایگاه دادۀ ISLES 2018، بیشتر از 75 درصد گزارش شده است. با توجه به عملکرد مطلوب روش پیشنهادی، میتوان از آن برای تشخیص خودکار ضایعۀ سکتۀ مغزی ایسکمیک بدون نیاز به تشخیص بصری استفاده کرد.
[2] R. Guerrero, O. Oktay, C. Bowles a, L. Chen a, R. Joules b, R. Wolz b a, M.C. Valdés-Hernández c, "White matter hyperintensity and stroke lesion segmentation and differentiation using convolutional neural networks", NeuroImage: Clinical, Vol. 10, pp. 978-934, 2019.
[3] S. Rekik, T. K. Allassonnière, J. M. Carpenter, Wardlaw, "Medical image analysis methods in MR/CT-imaged acute-subacute ischemic stroke lesion: Segmentation, prediction and insights into dynamic evolution simulation models. A critical appraisal", NeuroImage: Clinical, Vol. 1, No. 1, pp. 164-178, 2012.
[4] Y. Zhou, W. Huang, P. Dong, Y. Xia, S. Wang, "D-UNet: a dimension-fusion U shape network for chronic stroke lesion segmentation", IEEE/ACM transactions on computational biology and bioinformatics, Vol. 18, No. 3, pp. 940-950, 2019.
[5] Y. Wang, A. K. Katsaggelos, X. Wang, T. B. Parrish, "A deep symmetry convnet for stroke lesion segmentation", IEEE International Conference on Image Processing (ICIP), pp. 111-115, 2016.
[6] J. Mitra Pierrick Bourgeat, Jurgen Fripp, S. Ghose, S. Rose, O. Salvado, A. Connelly, B. Campbell; "Lesion segmentation from multimodal MRI using random forest following ischemic stroke", NeuroImage, Vol. 98, pp. 324-335, 2014.
[7] O. Maier, M. Wilms, J. von der Gablentz, U. M. Krämer, T. F. Münte, H. Handels, "Extra tree forests for sub-acute ischemic stroke lesion segmentation in MR sequences", Journal of neuroscience methods, Vol. 240, pp. 89-100, 2015.
[8] Y. Zhang, S. Liu, C. Li, J. Wang, "Application of deep learning method on ischemic stroke lesion segmentation", Journal of Shanghai Jiaotong University (Science), Vol. 27, No. 1, pp. 99-111, 2022.
[9] K. Qi, Hao Yang, Cheng Li, Zaiyi Liu, Meiyun Wang, Qiegen Liu and Shanshan Wang, "X-net: Brain stroke lesion segmentation based on depthwise separable convolution and long-range dependencies", International conference on medical image computing and computer-assisted intervention, pp. 247-255, Springer, 2019
[10] R. Guerrero, C. Qin, O. Oktay, C. Bowles, L. Chen, R. Joules, R. Wolz, M. C. Valdés-Hernández, "White matter hyperintensity and stroke lesion segmentation and differentiation using convolutional neural networks", NeuroImage: Clinical, Vol. 17, pp. 918-934, 2018.
[11] M. Soltanpour, R. Greiner, P. Boulanger, B. Buck, "Ischemic stroke lesion prediction in CT perfusion scans using multiple parallel u-nets following by a pixel-level classifier", IEEE 19th International Conference on Bioinformatics and Bioengineering (BIBE), pp. 957-963, 2019.
[12] P. Liu, "Stroke lesion segmentation with 2D novel CNN pipeline and novel loss function", International MICCAI Brainlesion Workshop, pp. 253-262: Springer, 2018.
[13] J. Dolz, I. Ben Ayed, C. Desrosiers, "Dense multi-path U-Net for ischemic stroke lesion segmentation in multiple image modalities", International MICCAI Brainlesion Workshop, pp. 271-282, Springer, 2018.
[14] G. Wang, T. Song, Q. Dong, M. Cui, N. Huang, S. Zhang, "Automatic ischemic stroke lesion segmentation from computed tomography perfusion images by image synthesis and attention-based deep neural networks", Medical Image Analysis, Vol. 65, p. 101787, 2020.
[15] A. Clèrigues, S. Valverde, J. Bernal, J. Freixenet, A. Oliver, X. Lladó, "Acute ischemic stroke lesion core segmentation in CT perfusion images using fully convolutional neural networks", Computers in Biology and Medicine, Vol. 115, p. 103487, 2019.
[16] R. Ghnemat, A. Khalil, and Q. Abu Al-Haija, "Ischemic stroke lesion segmentation using mutation model and generative adversarial network," Electronics, vol. 12, no. 3, p. 590, 2023.
[17] C. S. P. Raju, A. M. Kirupakaran, B. C. Neelapu, R. H. Laskar, "Ischemic Stroke Lesion Segmentation in CT Perfusion Images Using U-Net with Group Convolutions", International Conference on Computer Vision and Image Processing, pp. 276-288, Springer, 2022.
[18] M. Soltanpour, R. Greiner, P. Boulanger, B. Buck, "Improvement of automatic ischemic stroke lesion segmentation in CT perfusion maps using a learned deep neural network", Computers in Biology and Medicine, Vol. 137, p. 104849, 2021.
[19] Isles challenge 2018 ischemic stroke lesion segmentation. www.isles-challenge.org.
[20] M. Defferrard, X. Bresson, P. Vandergheynst, "Convolutional neural networks on graphs with fast localized spectral filtering", Advances in neural information processing systems, Vol. 29, 2016.
[21] A. Lazcano, P. J. Herrera, M. Monge, "A Combined Model Based on Recurrent Neural Networks and Graph Convolutional Networks for Financial Time Series Forecasting", Mathematics, Vol. 11, No. 1, p. 224, 2023.
[22] A. Fabijanska, "Graph Convolutional Networks for Semi-Supervised Image Segmentation", IEEE Access, Vol. 10, pp. 104144-104155, 2022.
[23] J. Zhang, Y. Zhang, Y. Jin, J. Xu, X. Xu, "MDU-Net: multi-scale densely connected U-Net for biomedical image segmentation", Health Information Science and Systems, Vol. 11, No. 1, p. 13, 2023.
[24] W. Weng, X. Zhu, L. Jing, M. Dong, "Attention Mechanism Trained with Small Datasets for Biomedical Image Segmentation", Electronics, Vol. 12, No. 3, p. 682, 2023.