Document Type : Research Article
Authors
Department of electrical engineering, Faculty of Engineering, University of Yazd, Yazd, Iran
Abstract
Keywords
مجموعه دادگان آموزش باشد که در آن برچسب هر کلاس و بیانگر دادگان EEG است و هر تک ثبت EEG شامل n نمونه باشد، به صورت که است، تعریف میشود و d هم تعداد کانالها را مشخص میکند. اگر تعداد قطعات مد نظر برای قطعه بندی kتا باشد، نقاط شکست بین این قطعات به صورت که تعریف میشود. سپس تابعی با نام Make Vector ( ) تعریف میشود که به وسیله آن نرخ نمونه برداری در کاهش یافته و به یک بردار تبدیل میشود:
(8) |
به دست آمده توسط این تابع یک بردار d×k بعدی است و پس از اعمال این تابع به دادگان آموزش، مجموعه E به تبدیل میشود: . حال و و W از روی دادگان محاسبه میشوند تا معیار جداپذیری فیشر در فضای جدید به دست آید که چون و و W محاسبه شده تابعی از T خواهند شد، معیار J هم تابعی از T میشود و معادله (7) به معادله زیر تبدیل میشود:
(9) |
نهایتاً مسأله یافتنِ قطعاتی که درجه تفکیک بین کلاسها را بیشینه کند، به مسأله یافتن بهینه تقلیل مییابد که آن را میتوان در رابطه زیر خلاصه کرد:
(10) |
|
با استفاده از الگوریتم LIR توضیح داده شده و با توجه به آنکه هدف، بیشینه کردن میزان تفکیک بین دو کلاس است، الگوریتم زمانی متوقف میشود که در دو اجرای متوالی آن، مقدار معیار تفکیک پذیری (J) بیشتر نشود یا ثابت بماند. برای مثال، در شکل (3) روند تغییرات J هنگام اجرای الگوریتم برای سوژه A رسم شده است.
شکل (3): روند تغییرات معیار تفکیک پذیری دو کلاس (J) هنگام اجرای الگوریتم LIR برای سوژه A
پس از همگرا شدن الگوریتم، بردار ویژگی حاصل میشود. در این بردار، تعداد ویژگیها به ازای هر کانال برابر تعداد قطعات (k) است که هر ویژگی به صورت میانگین مقادیر دامنه نمونهها در قطعه مربوطه تعریف میشود (مطابق شکل (2)). بردار ویژگی برای هر کاراکتر از متوالی کردن ویژگیهای کانالهای هفتگانه پشت سر هم به دست میآید؛ یعنی بُعد بردار حاصل برای هر کاراکتر برابر 7k میشود.
مسأله مهم دیگر در مورد این الگوریتم، انتخاب k مناسب است، زیرا اگر k بیش از حد کوچک باشد، ممکن است تقریب حاصل از سیگنال، تقریب مناسبی نباشد و بخشی از اطلاعات مهم سیگنال از دست برود و از طرفی اگر هم k بیش از اندازه بزرگ شود، دیگر به خواسته اصلی خود که کم کردن حجم دادگان و جلوگیری از مشکل نفرین ابعاد است، نمیرسیم. بر این اساس، با آزمودن چند مقدار متوالی برای k و محاسبه دقت سیستم با استفاده از طبقهبندیکننده SWLDA[1] در هر آزمون، نهایتاً k مناسب برای دادگان استفاده شده در اینجا، که صحت در آن بیش از kهای قبلی و بعدی بود(k=10)، انتخاب شد. نتایج بررسی kهای مختلف در جدول (1) آمده است.
جدول(1): بررسی اثرتغییرات تعداد قطعات روی صحت طبقهبندی کننده
تعداد قطعات (k) |
درصد صحت طبقهبندی |
8 |
8/92% |
9 |
9/92% |
10 |
6/94% |
11 |
5/94% |
12 |
94% |
الگوهای مکانی مشترک (CSP)
کارایی فیلتر کردن مکانی برای بهبود رزولوشن مکانی و نسبت سیگنال به نویز در سیگنال EEG قبلاً ثابت شده است[24،23]. برخی از انواع فیلترهای مکانی مبتنی بر روشهای EEG referencing هستند. این فیلترها به عنوان فیلترهای مکانی بالاگذری عمل میکنند که فعالیت محلی را تقویت و فعالیت توزیع شده را ضعیف می کنند. یک ایده متفاوت، فیلترهای مکانی با نام الگوهای مکانی مشترک- که بیشتر برای روشهای بازشناسی الگو طراحی شده- در سال 1995 توسط Koles مطرح شد[23] و نخستین بار برای تجزیه مؤلفههای نوروفیزیولوژیک در کاربردی کلینیکی از الکتروانسفالوگرافی استفاده شد. روش الگوهای مکانی مشترک بر اساس قطری سازی همزمان دو ماتریس متقارن حقیقی (که توسط Fukunaga ارائه شدند[24]) کار میکند. قطری سازی همزمان اجازه تجزیه سیگنال EEG خام به دو الگوی مجزا از دو کلاس را میدهد که در این دو کلاس به صورت همزمان، واریانس یکی از کلاسها بیشینه و واریانس دیگری کمینه شده است. در این صورت، اگر تنها از فیلترهای با قابلیت تفکیک بیشتر استفاده شود، ابعاد داده هم کاهش مییابد و عملکرد طبقه بندی کننده نیز بهتر میشود.
این روش به صورت موفقیت آمیزی در تحقیقات BCI برای استخراج و افزایش ERD/ERS و در مسائل تفکیک تصورات حرکتی[2]به کار رفته است، ولی کاربرد روش CSP در آشکارسازی ERP و P300 بسیار کم بوده و در تحقیقات کمی از آن استفاده شده است [25،26،27]. یکی از روشهای استخراج ویژگی مورد استفاده در این مقاله، روش الگوهای مکانی مشترک است که در اینجا به بیان مفهوم آن میپردازیم[28]:
فرض کنید و هرکدام ماتریسی N×T باشند که N تعداد کانالهای ثبت و T تعداد نمونههای زمانی از هر کانال باشد و این دو ماتریس به ترتیب مربوط به دادگان هدف (حاوی مؤلفه P300) و دادگان غیرهدف (فاقد P300) هستند. روش CSP بر اساس تجزیه مؤلفه اصلی ماتریس کوواریانس R است که این ماتریس از مجموع ماتریس کوواریانسهای دادگان هدف ( ) و غیر هدف ( ) به دست میآید[28]. تجزیه این ماتریس در رابطه (11) نشان داده شده است.
(11) |
در رابطه (11)، A ماتریس متعامد بردارهای ویژه و ماتریس قطری مقادیر ویژه است. اکنون با استفاده از ماتریس سفیدکنندگی W، ماتریس کوواریانس به ماتریس همانی I تبدیل میشود.
(12) |
|
(13) |
سپس با استفاده از تبدیل سفید کردن برای هر کلاس به دست میآید:
(14) |
|
با استفاده از سه رابطه اخیر به دست میآید:
(15) |
با اعمال آنالیز مؤلفههای اصلی به روابط (14) داریم:
(16) |
و از (15) و (16) نتیجه میشود:
(17) |
|
(18) |
با توجه به روابط فوق دیده میشود که هر دو کلاس بردارهای ویژه یکسان دارند و ترتیب صعود و نزول مقادیر ویژه آنها برعکس یکدیگر است. به این ترتیب، یک تبدیل بهینه کننده به دست میآید که میتواند حجم محاسبات را کاهش دهد؛ زیرا با این وضعیت اولین و آخرین سطرهای ماتریس بردارهای ویژه بیشترین اهمیت در تفکیک بین دو کلاس را دارد و پس از آنها دومین سطر و سطر ماقبل آخر و به همین منوال تا آخر. اگر و به عنوان اولین و آخرین بردارهای ویژه با بُعد N×1 تعریف شوند، فیلترهای مکانی به صورت زیر طراحی میشوند:
(19) |
|
و دادگان فیلتر شده به وسیله این فیلترها از رابطه (20) به دست میآیند؛ که در آن H ماتریس یا برداری از فیلترهای منتخب است.
(20) |
همان طور که روابط فوق نشان داد، الگوهای مکانی مشترک یک روش استخراج ویژگی است که ضمن آن کاهش بعد هم صورت میگیرد و بهجای استفاده از تعداد زیادی کانال، در فضایی جدید، کانالهای جایگزین کمتری با قابلیت تفکیک بیشتر دو کلاس فراهم میشود. بنابراین برای استخراج ویژگیها با این روش، از کلیه سیگنالهای ثبت شده در 64 کانال استفاده شد که خود سبب افزایش حجم دادگان میشد. برای مقابله با این مسأله، پس از اعمال یک فیلتر آنتی الیاسینگ، از کاهش نرخ نمونه برداری استفاده کرده، تعداد دادگان در هر قطعه یک ثانیهای از 240 نمونه به 24 نمونه کاهش داده شد. پس از آن با اعمال CSP، بردارها و مقادیر ویژه هر کلاس طبق روابط (17) و (18) محاسبه شدند. سپس از دو بردار ویژه ابتدایی و دو بردار ویژه انتهایی ماتریس بردارهای ویژه برای ساخت ماتریس فیلترهای مکانی استفاده شد و ماتریس H با اندازه N×4 به دست آمد. برای استخراج ویژگیهای CSP، با توجه به تحقیقات قبلی [28] دو دسته ویژگی بیشتر مطرح بود: دسته اول ویژگیها در واقع همان دادگان زمانی هستند که توسط فیلتر مکانی تهیه شده فیلتر شدهاند؛ به صورتی که هر داده زمانی N×T بُعدی - که N تعداد کانالهای ثبت (64 تا) و T تعداد نمونههای زمانی از هر کانال است به داده فیلتر شده 4×T بعدی تبدیل میشود، دسته دوم ویژگیهایی مبتنی بر واریانس هستند که بیشتر در کاربردهای تصورات حرکتی سیستمهای BCI کاربرد دارند. این ویژگیها در بحثهای تصورات حرکتی معمولاً به صورت نسبتِ واریانس یک داده فیلتر شده به مجموع واریانسهای کل دادگان فیلتر شده تعریف میشوند. برای ساخت این دسته ویژگیها طبق رابطه زیر، برای هر داده زمانی چهار ویژگی جدید به دست میآید:
(21) |
که در آن S یک داده زمانی T×N بعدی و سطر kام از ماتریس H در رابطه (20) (متناظر با یک بردار ویژه) است. به این ترتیب، بردار ویژه حاصل از CSP هم با متوالی کردن این دو دسته ویژگی به دست میآید.
پس از محاسبه ویژگیهای مختلف، نوبت به ارزیابی ویژگیها میرسد. ارزیابی ویژگیها در هر دو حالت تکی و گروهی قابل بررسی است. بدین منظور، ابتدا با استفاده از آزمون آماری t-test تک تک ویژگیها ارزیابی شدند تا مشخص شود که در هر دسته ویژگی کدام ویژگیها اطلاعات بیشتر و مفیدتری از سیگنال را دارا هستند. در قدم بعدی یک بار از طبقهبندیکننده LDA برای بررسی هر دسته ویژگی استفاده شد تا مشخص شود که کدام دسته ویژگی توانایی بیشتری در تفکیک دو کلاس دارد. یک بار هم از طبقهبندی کننده SWLDA استفاده شد. در این روش، ابتدا هر دسته ویژگی با استفاده از تحلیل تفکیکی گام به گام و با معیار Wilk’s Lambda تحلیل و ویژگیهای منتخب آن مشخص شد و سپس کار طبقهبندی با LDA صورت پذیرفت.
هدف نهایی در هر مسأله شناسایی الگو، تفکیک مجموعهای از نمونهها به دو یا چند کلاس مختلف است. در این جا هدف نهایی، تفکیک سیگنالها به دو گروه حاوی P300 و فاقد P300 است. در این مقاله، از طبقهبندی کنندههای SWLDA و LDA (که در کارهای قبلی هم نتایج خوبی با استفاده ازاین طبقهبندیکنندهها گزارش شده بود)[29] استفاده شد.
LDA سادهترین و پرکاربردترین طبقهبندیکننده آماری است[29]. این طبقهبندیکننده در فرم استانداردش یک طبقهبندیکننده باینری است که با اعمال تخمین MAP[3] و با فرض گوسی بودن تابع توزیع احتمال شرطی ویژگیها در فضای ویژگی و همچنین تساوی ماتریسهای کوواریانس کلاسها محاسبه میشود.
در این بخش نتایج کمّی به دست آمده در قسمتهای مختلف، بیان شده، تحلیلهای حاصل از آنها ارائه خواهد شد.
برای بررسی ویژگیهای مختلف و میزان تغییرات آنها در دو گروه مورد بررسی (هدف و غیرهدف)، در نخستین گام آزمون t-test برای تک تک ویژگیها اجرا شد. متغیرهای مورد بررسی در این ارزیابی، ویژگیهای استخراج شده از تک ثبتها بودند و کلاسهای مورد مقایسه، دو گروه حاوی P300 و فاقد P300 (هدف و غیرهدف) بودند.
نتایج شکل (4) نشان میدهد که در ارزیابی ویژگیهای قطعهبندی هوشمند به صورت تک تک و با آزمون t-test، در اغلب کانالها ویژگیهای 3، 4 و 5 جزو ویژگیهای برتر بودهاند. از طرفی، با توجه به مرزهای حاصل از قطعهبندی، مشخص میشود که ویژگیهای 3، 4 و 5 مربوط به بازه زمانی 200 تا 508 میلیثانیه (محدوده رخداد مؤلفه P300) هستند.
همچنین، با بررسی الگوریتم LIR پیادهسازی شده، مشخص شد که مرزهای ده قطعه حاصل بر حسب نمونه به صورت 0، 32، 42، 55، 91، 122، 146، 160، 166، 239 و 240 یا بر حسب زمان به صورت 0، 133، 200، 229، 379، 508، 608، 667، 692، 996 و 1000 میلیثانیه بوده است. در شکل (5) نمونهای از متوسط سیگنالهای هدف و غیرهدف، قبل و پس از قطعهبندی هوشمند دیده میشود.
با توجه به محل قرار گرفتن این مرزها، مشخص است که در قسمتهایی که تفاوت شکل موج دو سیگنال هدف و غیر هدف بیشتر بوده، تعداد قطعه بیشتری تعریف شده است، اما در قسمتهایی که این تفاوت کمتر است، قطعات کمتر با طول بیشتر لحاظ شدهاند.
شکل(4): مقادیر |t-value| برای 10 ویژگی قطعهبندی هوشمند مربوط به هریک از هفت کانال انتخابی
شکل(5): بالا:متوسط کلیه سیگنالهای هدف قبل و پس از اعمال قطعهبندی هوشمند در کانال Cz، پایین:متوسط کلیه سیگنالهای غیر هدف قبل و پس از اعمال قطعهبندی هوشمند در کانال Cz
مثلاً در محدوده 133 تا 5/691 میلی ثانیه، که طبق تعاریف فیزیولوژیک سیگنال ERP، محل رخداد مؤلفههایی از قبیل N100، P300 و N400 (مؤلفههایی که هنگام اعمال یک تحریک هدف رخ میدهند) است، هفت قطعه تعریف شده، ولی در محدوده انتهایی سیگنال (692 تا 995 میلی ثانیه) تنها یک قطعه برای نشان دادن سیگنال به کار رفته است. به این ترتیب، با استفاده از این روش قطعهبندی هوشمند، میتوان بدون نگرانی از مشکلاتی مانند تعداد زیاد نمونهها و بالا رفتن بُعد بردار ویژگی، از مزایا و خواص مطلوب نمونههای زمانی سیگنال استفاده و قسمتهای مهم سیگنال را بارزتر نمود. در شکل (5) هم این مسأله به شکل واضحتر بر روی دو سیگنال هدف و غیر هدف و نتیجه اعمال قطعهبندی بر روی آنها نشان داده شده است.
شکل (6) مقادیر قدرمطلق t-value را به صورت صعودی برای دسته ویژگی CSP نشان میدهد. همان طور که در بخش 3-2 ذکر شد، این دسته ویژگی شامل دو نوع ویژگی است. نوع اول ویژگیهای حاصل از فیلتر کردن دادهها با فیلتر مکانی به دست آمده با روش CSP و نوع دوم ویژگیهای مبتنی بر واریانس، که طبق توضیحات قبلی برای هر ثبت، 96=24×4 ویژگی نوع اول و چهار ویژگی نوع دوم تعریف شد و به این طریق دسته ویژگی حاصل از CSP شامل 100 ویژگی شد. در ارزیابی ویژگیهای الگوی مکانی مشترک توسط آزمون t-test، در سه کانال از چهار کانال مورد استفاده در فضای CSP، ویژگیهای متعلق به بازه زمانی 542 -250 میلیثانیه (ویژگیهای 6 تا 13 هر کانال) ویژگیهای برتر بودهاند که تشابه این محدوده زمانی در هر دو دسته ویژگی قطعهبندی هوشمند و الگوهای مکانی مشترک، مؤید این مطلب است که در هر دو فضای دادگان خام و فضای CSP، ویژگیهای دو کلاس هدف و غیرهدف در بازه زمانی رخداد P300 تفاوت آشکاری با یکدیگر دارند و این بازه، بازه مناسبی برای استخراج ویژگیهای مؤثر و مفید در آشکارسازی P300 است. این ویژگیها در شکل (6) با رنگ سفید مشخص شدهاند و به وضوح مشخص است که تجمع آنها بیشتر در انتهای نمودار و مقادیر بیشتر |t-value| است.
شکل (6): مقادیر |t-value| برای دسته ویژگی الگوهای مکانی مشترک
در مورد این دسته ویژگی، ذکر این نکته هم مفید به نظر میرسد که ویژگیهای مبتنی بر واریانس (که در شکل (6) با رنگ خاکستری مشخص شدهاند)، ویژگیهای مطلوبی نبودهاند. البته، قبلاً هم ذکر شد که این ویژگیها بیشتر در سیستمهای BCI با کاربرد تصورات حرکتی استفاده میشوند. برای چنین سیستمهایی که در آنها ویژگیهای اصلی توانهای باند μ و β هستند، این نوع ویژگیها، ویژگیهای مناسبی هستند، ولی در بحث آشکارسازی P300 که مهمترین ویژگیها، ویژگیهای شکلی- زمانی هستند، نه واریانس سیگنال، بهتر است که از خود دادگان فیلتر شده به وسیله فیلترهای مکانی به عنوان ویژگی استفاده شود.
معیار دوم برای ارزیابی دسته ویژگیها، مقایسه درصد صحت تفکیک آنها با یک طبقهبندیکننده است. در اینجا از دو طبقهبندی کننده LDA و SWLDA استفاده شده است.ابتدا طبقهبندی کننده خطی LDA بر هر دسته ویژگی اعمال و دقت با روش[4]LOO محاسبه شده است. در جدول (2) این نتایج برای دو سوژه A و B و میانگین آن دو آورده شده است. بر اساس این نتایج، برای هر دو سوژه، قطعهبندی هوشمند سیگنال به روش LIR بهترین کارایی را داشته است.
جدول (2): نتایج ارزیابی گروهی ویژگیها با استفاده از صحت طبقهبندیکننده LDA
درصد صحت نوع ویژگی |
بعد بردار ویژگی |
سوژه |
هدف |
غیرهدف |
میانگین |
میانگین A و B |
قطعهبندی هوشمند |
70 |
A |
90% |
8/94% |
94% |
05/95% |
B |
5/90% |
2/97% |
1/96% |
|||
CSP |
100 |
A |
1/77% |
6/86% |
85% |
45/82% |
B |
4/72% |
4/81% |
9/79% |
در مرتبه دوم، روش تحلیل تفکیکی گام به گام به کار گرفته شد. با استفاده از این روش، ابتدا در هر دسته ویژگیهای برتر انتخاب شدند و سپس با طبقهبندیکننده SWLDA درصد صحت هر دسته محاسبه شد.
با اعمال این روشِ انتخاب ویژگی به دسته ویژگی اول، از میان 70 ویژگی قطعهبندی هوشمند، 20 ویژگی انتخاب شدند که در این میان هم بیشتر ویژگیها در همان محدوده رخداد P300 قرار دارند. در مورد دسته ویژگی CSP هم از میان 26 ویژگی منتخب این دسته، در اغلب کانالها ویژگیهای 5 تا 9 (مربوط به بازه 375- 208 میلیثانیه) انتخاب شدهاند. بنابراین، هر دو روش t-test و تحلیل تفکیکی گام به گام، بیانگر اهمیت بازه رخداد مؤلفه P300 هستند.
در مورد میزان صحت حاصل توسط طبقهبندیکننده SWLDA هم در جدول (3) بعد بردار ویژگی و درصد صحت برای هر دسته ویژگی و برای هرکدام از دو سوژه و به صورت میانگین آمده است.
جدول (3): نتایج ارزیابی ویژگیها با روش تحلیل تفکیکی گام به گام و صحت طبقهبندیکننده SWLDA
درصد صحت نوع ویژگی |
بعد بردار ویژگی |
سوژه |
هدف |
غیرهدف |
میانگین |
میانگین A و B |
قطعهبندی هوشمند |
20 |
A |
2/91% |
3/95% |
6/94% |
25/95% |
22 |
B |
9/92% |
5/96% |
9/95% |
||
CSP |
26 |
A |
9/82% |
9/87% |
1/87% |
4/83% |
28 |
B |
5/76% |
4/80% |
7/79% |
طبق جداول (2) و (3) دیده میشود که نتایج حاصل از این دو طبقهبندیکننده بسیار به هم نزدیک است، اما شاید بتوان حسن SWLDAرا در تعداد ویژگی کمتر استفاده شده در آن دانست؛ مثلاً در مورد ویژگیهای قطعهبندی هوشمند برای سوژه A، طبقهبندی کننده LDA از 70 ویژگی استفاده کرده، ولی در SWLDA تنها از 20 ویژگی استفاده شده است که این مسأله پیچیدگی تابع تصمیمگیری را کمتر کرده، تعمیمپذیری طبقهبندیکننده را افزایش میدهد. در واقع، برای حل مشکل LDA، روش SWLDA راه حلی ارائه داده است که با محدود کردن اندازه فضای ویژگی ورودی مشکل گستردگی ابعاد را برطرف کند. در این روش انتخاب ویژگی به صورت خودکار صورت میگیرد و جملات غیر مهم از مدل حذف میشوند. همچنین، میتوان الگوریتم را به شیوهای تنظیم کرد که سریعتر به همگرایی برسد
با توجه به آنچه تا کنون درباره دو دسته ویژگی قطعهبندی هوشمند و الگوهای مکانی مشترک گفته شد، این ایده به ذهن میرسد که شاید ترکیب دو روش فوق به منظور ساخت یک دسته ویژگی ترکیبی مناسب باشد، زیرا همان طور که بیان شد، مزیت روش CSP در این است که در فضایی جدید، از تعداد کانال کمتری استفاده میکند و حسن قطعهبندی هوشمند هم در این است که با به کار گیری تعداد کمی نمونه به ازای هر کانال میتواند به قدرت تفکیک بالایی در آشکارسازی P300 برسد، اما در روش قطعهبندی از تعداد کانال زیادی استفاده شد که این امر حجم محاسبات را افزایش میدهد، بنابراین، میتوان با ترکیب دو روش فوق، علاوه بر استفاده از مزایای دو روش، حجم محاسبات را هم کاهش داد. با این ایده دسته ویژگی ترکیبی CSP+LIR ساخته شد تا نتایج حاصل از آن نیز ارزیابی گردد.
برای ساخت این دسته ویژگی، ابتدا CSP در نقش یک کاهش دهنده بُعد ظاهر شده، دادگان را به فضایی جدید میبرد که با وجود استفاده از تعداد کانال کمتر در آن فضا، قابلیت تفکیک زیادی از دست نمیرود و در عین حال، از مزیت کاهش تعداد کانالها هم بهره برده میشود. سپس با استفاده از روش قطعهبندی هوشمند حجم دادگان را کاهش داده، دادگان بهینهتری را انتخاب میکنیم. با تکیه بر این ایده، این دسته ویژگی ترکیبی (با استفاده از همان پارامترهای به کار رفته در دو روش قطعهبندی هوشمند و CSP) ساخته شد؛ یعنی با استفاده از تعداد قطعه بهینه محاسبه شده (k=10)، این روش ترکیبی شامل 40 ویژگی روی مجموع 4 کانالِ منتخب فضای جدید CSP است. نتایج ارزیابی این دسته ویژگی از دو دیدگاه تکی و گروهی در ادامه آمده است.
در ارزیابی تکی این ویژگیها با آزمون t-test دیده میشود که در این دسته ویژگی نیز، مشابه دسته ویژگی اول و دوم، ویژگیهای مربوط به بازه رخداد P300 (ویژگیهای 3 تا 6 هر کانال)ویژگیهای مناسبی بودهاند و اختلاف آنها در دو کلاس مشهود بوده است. نمودار صعودی قدرمطلق مقادیر t-value برای ویژگیهای ترکیبی در شکل (7) (که ویژگیهای3 تا 6 هر کانال در آن با رنگ سفید مشخص شده است) مؤید همین مطلب است. نتایج ارزیابی گروهی این دسته ویژگی با دو طبقهبندیکننده LDA و SWLDA در جدول (4) خلاصه شده است.
شکل(7): مقادیر |t-value| برای دسته ویژگی ترکیبی CSP+LIR
جدول(4): نتایج ارزیابی گروهی دسته ویژگی ترکیبی
درصد صحت طبقهبندیکننده |
بعد بردار ویژگی |
سوژه |
هدف |
غیرهدف |
میانگین |
میانگین A و B |
LDA |
40 |
A |
3/85% |
2/86% |
1/86% |
2/85% |
40 |
B |
8/78% |
4/85% |
3/84% |
||
SWLDA |
18 |
A |
1/84% |
2/86% |
9/85% |
05/84% |
17 |
B |
8/78% |
8/82% |
2/82% |
در دسته ویژگی ترکیبی، فرضیه اولیه این بود که با بهرهمندی از مزایای هر دو روش قبلی احتمالاً باید به نتایج برتری نسبت به هر دو روش به صورت مجزا، دست یافت، اما طبق جدول (4) دیده شد، که هرچند نتایج روش ترکیبی از روش CSP بهتر شد، اما باز هم ضعیفتر از روش قطعهبندی است. این مسأله نشان میدهد که به کارگیری قطعهبندی در فضای خام دادگان و روی تعداد کانال بیشتر، کارایی بهتری نسبت به اعمال آن در فضای جدید با تعداد کانال کمتر دارد.
یک مسأله جانبی دیگر در مورد ویژگیهای انتخاب شده به روش تحلیل تفکیکی گام به گام است. دیده میشود که در این دسته ویژگی هم غالباً ویژگیهای مربوط به بازه رخداد P300 برگزیده شدهاند، به طوری که در بین 18 ویژگی انتخابی این دسته ویژگی، اکثر آنها (ویژگیهای 2 تا 6 در هر کانال) در بازه زمانی 693- 147 میلیثانیه قرار میگیرند.
در این مطالعه، تلاش بر این بود تا با استفاده از یک سیستم مبتنی بر بازشناسی الگو به آشکارسازی P300 پرداخته شود و ضمن آن، کارایی سه روش مختلف استخراج ویژگی هم بررسی شود. دسته ویژگی اول، ویژگیهای حاصل از قطعهبندی هوشمند سیگنال بودند. قطعهبندی، روش رایجی برای استخراج ویژگی در سیستمهای بازشناسی الگوست، اما کاربرد آن در آشکارسازی مؤلفه P300 تا کنون بسیار کم بوده است. روش دوم هم استفاده از فیلتر کردن مکانی و الگوهای مکانی مشترک بود که هرچند در سایر حوزههای BCI پرکاربرد بوده، اما ویژگیهای مستخرج از آن غالباً به گونهای بودهاند(ویژگیهای مبتنی بر واریانس) که در سیستمهای مبتنی بر P300 توفیق چندانی نداشتهاند. در این مقاله سعی شد تا با تعریف نوع دیگری از ویژگیهای مبتنی بر CSP، کارایی هر دو نوع ویژگی در آشکارسازی P300 محک زده شود. در دسته ویژگی آخر هم از ترکیب دو روش استفاده شد تا از مزایای هر دو روش قبل بهره برده شود؛ یعنی هم با استفاده از CSP تعداد کانالها را کاهش داد و هم با روش قطعهبندی هوشمند و کاهش نرخ نمونهبرداری وفقی حجم محاسبات را کم کرد. بدین ترتیب، سه دسته ویژگی مختلف به دست آمد که با سه معیار t-test، استفاده از درصد صحت طبقهبندیکننده LDA و استفاده از روش SWLDA به ارزیابی آنها پرداخته شد که نتایج به دست آمده نشان دهنده برتری روش قطعهبندی هوشمند نسبت به سایر روشها بود؛ .به طوری که با هر دو طبقهبندیکننده LDA و SWLDA بالاترین درصد صحت میانگین (25/95%) توسط این دسته ویژگی به دست آمد. این درصد صحت بالا بیانگر قدرت و توانایی این دسته ویژگی و اهمیت نحوه تقسیمبندی سیگنال است. برتری روش قطعهبندی هوشمند نسبت به سایر روشهای کاهش نرخ نمونهبرداری در این است که این روش یک روش وفقی و آموزشپذیر است که سعی میکند مرزهای قطعات را به نحوی تعیین کند که در عین زیاد کردن اختلاف بین دو کلاس، کمترین میزان اطلاعات از دست برود. همچنین، این روش کاهش نرخ نمونهبرداری این امکان را فراهم میکند تا از قسمتهایی از سیگنال که اهمیت بیشتری دارد و حاوی اطلاعات بیشتری است، تعداد نمونههای بیشتری ذخیره کرد و در عوض نمونههای حفظ شده از قسمتهای کم اهمیتتر را کاهش داد.
در مورد ویژگیهای CSP، هرچند ویژگیهایی که از دادگان فیلتر شده به وسیله فیلتر مکانی تهیه شدند، به مراتب از ویژگیهای مبتنی بر واریانس بهتر بودند، اما بازهم کارایی روش قطعهبندی هوشمند برتر از روش CSP است و این مسأله در نتایج حاصل از طبقهبندیکنندهها به وضوح مشخص است.
آخرین نکته، از نتایج t-test به دست میآید. طبق این نتایج در هر سه دسته ویژگی، ویژگیهایی که متعلق به محدوده زمانی رخداد P300 هستند، دارای |t-value| بالایی هستند و قدرت تفکیک دو کلاس در آنها بالاست. این قضیه اهمیت بازهزمانی رخداد P300 را بیش از پیش نمایان میکند.
در مقام قیاس با سایر مطالعات انجام گرفته در این زمینه نیز باید گفت که نتایج حاصل از این تحقیق، نتایج خوب و قابل قبولی هستند؛ برای مثال، میتوان به کارهای افرادی مانندYang Liu ، Seller و یا Salvaris اشاره کرد که با روشهای مختلفی روی همین دادگان کار کردهاند و نتایج ضعیفتری به دست آوردهاند. همانطور که در قسمت مقدمه هم ذکر شد؛ Yang Liuبا روش T-weighted، روی دادگان سال 2005 به صحت 90% در تشخیص کاراکتر رسید و یا Krusinski و Sellers توانستند با حداکثر 60 ویژگی مدل، به صحت 5/92% روی این دادگان دست یابند. همچنین، بهترین صحت حاصل توسط Salvaris و همکارانش با استفاده از تبدیل موجک گسسته و طبقهبندی کننده FLD، صحت میانگین 95% بوده است، اما در این تحقیق ما توانستیم به صحت متوسط25/95% برسیم.