ارزیابی و مقایسه روش‌های الگوهای مکانی مشترک و قطعه‌بندی هوشمند در آشکارسازی مؤلفه P300

نوع مقاله: مقاله علمی فارسی

نویسندگان

1 کارشناس ارشد، دانشکده مهندسی برق و کامپیوتر- دانشگاه یزد- یزد- ایران

2 استادیار، دانشکده مهندسی برق و کامپیوتر- دانشگاه یزد- یزد- ایران

چکیده

هدف از این مقاله ارزیابی دو روش قطعه­بندی هوشمند و الگوهای مکانی مشترک به عنوان دو راهکار استخراج ویژگی در سیستم‍های آشکارسازی مؤلفهP300 است. بدین منظور، یک سیستم مبتنی بر بازشناسی آماری الگو طراحی شد. در این سیستم که با دادگان P300-Speller مسابقات BCI 2005 کار می­کند، پس از اعمال پیش­پردازش­های اولیه، دو دسته ویژگی قطعه­بندی هوشمند و الگوهای مکانی مشترک از دادگان استخراج گردید. این ویژگی­ها از دو دیدگاه تکی (با آزمون t-test،) و گروهی (با استفاده از درصد صحت طبقه­بندی­کننده LDA و انتخاب ویژگی به روش تحلیل تفکیکی گام به گام و محاسبه درصد صحت با طبقه­بندی­کننده SWLDA) سنجش شدند که در نهایت، دسته ویژگی قطعه­بندی هوشمند با کسب بالاترین درصد صحت (25/95%) به عنوان روش برتر انتخاب شد.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation and Comparision of Common Spatial Patterns (CSP) and Intelligent Segmentation in P300 Detection

نویسندگان [English]

  • zahra amini 1
  • vahid Abootalebi 2
  • mohammad taghi Sadeghi 2
1 Department of electrical engineering, Faculty of Engineering, University of Yazd, Yazd, Iran
2 Department of electrical engineering, Faculty of Engineering, University of Yazd, Yazd, Iran
چکیده [English]

In This Paper, two different feature extraction methods were studied and their performances in pattern recognition based- P300 detection were compared. These two methods were Common Spatial Pattern (CSP) and intelligent segmentation. Data set II (P300 speller) from the BCI competition 2005 was used. After pre-processing and feature extraction, these features were compared. For this purpose, first, a statistical analysis had been applied for evaluating the fitness of each feature in discriminating between target and non target signals. Then, each of these two groups of features was evaluated by a Linear Discriminant Analysis (LDA) classifier. Furthermore by using Stepwise Linear Discriminant Analysis (SWLDA), the best set of features was selected. Finally in this research, the best result for P300 detection was 95.25% for intelligent segmentation as a feature extraction method. This result shows that intelligent segmentation is better than CSP method for P300 detection.

کلیدواژه‌ها [English]

  • CSP (Common Spatial Pattern)
  • Classification
  • Feature Extraction
  • Intelligent Segmentation
  • P300

 مجموعه دادگان آموزش باشد که در آن  برچسب هر کلاس و  بیانگر دادگان EEG است و هر تک ثبت EEG شامل n نمونه باشد،  به صورت  که  است، تعریف می­شود و d هم تعداد کانال­ها را مشخص می­کند. اگر تعداد قطعات مد نظر برای قطعه بندی kتا باشد، نقاط شکست بین این قطعات به صورت  که  تعریف می­شود. سپس تابعی با نام Make Vector ( ) تعریف می­شود که به وسیله آن نرخ نمونه برداری در  کاهش یافته و به یک بردار تبدیل می­شود:

 

 

 

(8)

 

 

  به دست آمده توسط این تابع یک بردار d×k بعدی است و پس از اعمال این تابع به دادگان آموزش، مجموعه E به  تبدیل می‍شود: . حال  و  و W از روی دادگان  محاسبه می­شوند تا معیار جداپذیری فیشر در فضای جدید به دست آید که چون  و  و W محاسبه شده تابعی از T خواهند شد، معیار J هم تابعی از T می­شود و معادله (7) به معادله زیر تبدیل می‍شود:

(9)

 

 

نهایتاً مسأله یافتنِ قطعاتی که درجه تفکیک بین کلاس‌ها را بیشینه کند، به مسأله یافتن  بهینه تقلیل می­یابد که آن را می­توان در رابطه زیر خلاصه کرد:

(10)

 
 

 

با استفاده از الگوریتم LIR توضیح داده شده و با توجه به آنکه هدف، بیشینه کردن میزان تفکیک بین دو کلاس است، الگوریتم زمانی متوقف می­شود که در دو اجرای متوالی آن، مقدار معیار تفکیک پذیری (J) بیشتر نشود یا ثابت بماند. برای مثال، در شکل (3) روند تغییرات J هنگام اجرای الگوریتم برای سوژه A رسم شده است.

 

 

شکل (3): روند تغییرات معیار تفکیک پذیری دو کلاس (J) هنگام اجرای الگوریتم LIR برای سوژه A

 

پس از همگرا شدن الگوریتم، بردار ویژگی حاصل می­شود. در این بردار، تعداد ویژگی­ها به ازای هر کانال برابر تعداد قطعات (k) است که هر ویژگی به صورت میانگین مقادیر دامنه نمونه­ها در قطعه مربوطه تعریف می­شود (مطابق شکل (2)). بردار ویژگی برای هر کاراکتر از متوالی کردن ویژگی­های کانال­های هفتگانه پشت سر هم به دست می­آید؛ یعنی بُعد بردار حاصل برای هر کاراکتر برابر 7k می­شود.

مسأله مهم دیگر در مورد این الگوریتم، انتخاب k مناسب است، زیرا اگر k بیش از حد کوچک باشد، ممکن است تقریب حاصل از سیگنال، تقریب مناسبی نباشد و بخشی از اطلاعات مهم سیگنال از دست برود و از طرفی اگر هم k بیش از اندازه بزرگ شود، دیگر به خواسته اصلی خود که کم کردن حجم دادگان و جلوگیری از مشکل نفرین ابعاد است، نمی‌رسیم. بر این اساس، با آزمودن چند مقدار متوالی برای k و محاسبه دقت سیستم با استفاده از طبقه­بندی­کننده SWLDA[1] در هر آزمون، نهایتاً k مناسب برای دادگان استفاده شده در اینجا، که صحت در آن بیش از kهای قبلی و بعدی بود(k=10)، انتخاب شد. نتایج بررسی kهای مختلف در جدول (1) آمده است.

جدول(1): بررسی اثرتغییرات تعداد قطعات روی صحت طبقه­بندی کننده

تعداد قطعات (k)

درصد صحت طبقه­بندی

8

8/92%

9

9/92%

10

6/94%

11

5/94%

12

94%

 

الگوهای مکانی مشترک (CSP)

کارایی فیلتر کردن مکانی برای بهبود رزولوشن مکانی و نسبت سیگنال به نویز در سیگنال EEG قبلاً ثابت شده است[24،23]. برخی از انواع فیلترهای مکانی مبتنی بر روش‌های EEG referencing هستند. این فیلترها به عنوان فیلترهای مکانی بالاگذری عمل می­کنند که فعالیت محلی را تقویت و فعالیت توزیع شده را ضعیف می ‌کنند. یک ایده متفاوت، فیلترهای مکانی با نام الگوهای مکانی مشترک- که بیشتر برای روش­های بازشناسی الگو طراحی شده- در سال 1995 توسط Koles مطرح شد[23] و نخستین بار برای تجزیه مؤلفه­های نوروفیزیولوژیک در کاربردی کلینیکی از الکتروانسفالوگرافی استفاده شد. روش الگوهای مکانی مشترک بر اساس قطری سازی همزمان دو ماتریس متقارن حقیقی (که توسط Fukunaga ارائه شدند[24]) کار می­کند. قطری سازی همزمان اجازه تجزیه سیگنال EEG خام به دو الگوی مجزا از دو کلاس را می‌دهد که در این دو کلاس به صورت همزمان، واریانس یکی از کلاس­ها بیشینه و واریانس دیگری کمینه شده است. در این صورت، اگر تنها از فیلترهای با قابلیت تفکیک بیشتر استفاده شود، ابعاد داده هم کاهش می­یابد و عملکرد طبقه بندی کننده نیز بهتر می‌شود.

این روش به صورت موفقیت آمیزی در تحقیقات BCI برای استخراج و افزایش ERD/ERS و در مسائل تفکیک تصورات حرکتی[2]به کار رفته است، ولی کاربرد روش CSP در آشکارسازی ERP و P300 بسیار کم بوده و در تحقیقات کمی از آن استفاده شده است [25،26،27]. یکی از روش­های استخراج ویژگی مورد استفاده در این مقاله، روش الگوهای مکانی مشترک است که در اینجا به بیان مفهوم آن می‍پردازیم[28]:

فرض کنید  و  هر­کدام ماتریسی N×T باشند که N تعداد کانال­های ثبت و T تعداد نمونه­های زمانی از هر کانال باشد و این دو ماتریس به ترتیب مربوط به دادگان هدف (حاوی مؤلفه P300) و دادگان غیرهدف (فاقد P300) هستند. روش CSP بر اساس تجزیه مؤلفه اصلی ماتریس کوواریانس R است که این ماتریس از مجموع ماتریس کوواریانس­های دادگان هدف ( )  و غیر هدف ( ) به دست می‍آید[28]. تجزیه این ماتریس در رابطه (11) نشان داده شده است.

(11)

 

 

در رابطه (11)، A ماتریس متعامد بردارهای ویژه  و  ماتریس قطری مقادیر ویژه  است. اکنون با استفاده از ماتریس سفیدکنندگی W، ماتریس کوواریانس  به ماتریس همانی I تبدیل می­شود.

(12)

 

(13)

 

 

سپس با استفاده از تبدیل سفید کردن برای هر کلاس به دست می­آید:

(14)

 
 

 

با استفاده از سه رابطه اخیر به دست می­آید:

(15)

 

 

با اعمال آنالیز مؤلفه­های اصلی به روابط (14) داریم:

(16)

 

 

و از (15) و (16) نتیجه می­شود:

(17)

 

(18)

 

 

با توجه به روابط فوق دیده می­شود که هر دو کلاس بردارهای ویژه یکسان دارند و ترتیب صعود و نزول مقادیر ویژه آنها برعکس یکدیگر است. به این ترتیب، یک تبدیل بهینه کننده به دست می­آید که می­تواند حجم محاسبات را کاهش دهد؛ زیرا با این وضعیت اولین و آخرین سطرهای ماتریس بردارهای ویژه بیشترین اهمیت در تفکیک بین دو کلاس را دارد و پس از آنها دومین سطر و سطر ماقبل آخر و به همین منوال تا آخر. اگر  و  به عنوان اولین و آخرین بردارهای ویژه با بُعد N×1 تعریف شوند، فیلترهای مکانی به صورت زیر طراحی می­شوند:

(19)

 
 

 

و دادگان فیلتر شده به وسیله این فیلترها از رابطه (20) به دست می­آیند؛ که در آن H ماتریس یا برداری از فیلترهای منتخب است.

(20)

 

 

همان طور که روابط فوق نشان داد، الگوهای مکانی مشترک یک روش استخراج ویژگی است که ضمن آن کاهش بعد هم صورت می‍گیرد و به­جای استفاده از تعداد زیادی کانال، در فضایی جدید، کانال­های جایگزین کمتری با قابلیت تفکیک بیشتر دو کلاس فراهم می‌شود. بنابراین برای استخراج ویژگی­ها با این روش، از کلیه سیگنال­های ثبت شده در 64 کانال استفاده شد که خود سبب افزایش حجم دادگان می­شد. برای مقابله با این مسأله، پس از اعمال یک فیلتر آنتی الیاسینگ، از کاهش نرخ نمونه برداری استفاده کرده، تعداد دادگان در هر قطعه یک ثانیه­ای از 240 نمونه به 24 نمونه کاهش داده شد. پس از آن با اعمال CSP، بردارها و مقادیر ویژه هر کلاس طبق روابط (17) و (18) محاسبه شدند. سپس از دو بردار ویژه ابتدایی و دو بردار ویژه انتهایی ماتریس بردارهای ویژه برای ساخت ماتریس فیلترهای مکانی استفاده شد و ماتریس H با اندازه N×4 به دست آمد. برای استخراج ویژگی­های CSP، با توجه به تحقیقات قبلی [28] دو دسته ویژگی بیشتر مطرح بود: دسته اول ویژگی­ها در واقع همان دادگان زمانی هستند که توسط فیلتر مکانی تهیه شده فیلتر شده­اند؛ به صورتی که هر داده زمانی N×T بُعدی - که N تعداد کانال­های ثبت (64 تا) و T تعداد نمونه­های زمانی از هر کانال است به داده فیلتر شده 4×T بعدی تبدیل می­شود، دسته دوم ویژگی­هایی مبتنی بر واریانس هستند که بیشتر در کاربردهای تصورات حرکتی سیستم­های BCI کاربرد دارند. این ویژگی­ها در بحث­های تصورات حرکتی معمولاً به صورت نسبتِ واریانس یک داده فیلتر شده به مجموع واریانس­های کل دادگان فیلتر شده تعریف می­شوند. برای ساخت این دسته ویژگی­ها طبق رابطه زیر، برای هر داده زمانی چهار ویژگی جدید به دست می‌آید:

(21)

 

 

که در آن S یک داده زمانی T×N بعدی و  سطر kام از ماتریس H در رابطه (20) (متناظر با یک بردار ویژه) است. به این ترتیب، بردار ویژه حاصل از CSP هم با متوالی کردن این دو دسته ویژگی به دست می­آید.

 

1-1- ابزارهای ارزیابی ویژگی

 

پس از محاسبه ویژگی­های مختلف، نوبت به ارزیابی ویژگی­ها می­رسد. ارزیابی ویژگی­ها در هر دو حالت تکی و گروهی قابل بررسی است. بدین منظور، ابتدا با استفاده از آزمون آماری t-test تک تک ویژگی­ها ارزیابی شدند تا مشخص شود که در هر دسته ویژگی کدام ویژگی­ها اطلاعات بیشتر و مفیدتری از سیگنال را دارا هستند. در قدم بعدی یک بار از طبقه­بندی­کننده LDA برای بررسی هر دسته ویژگی استفاده شد تا مشخص شود که کدام دسته ویژگی توانایی بیشتری در تفکیک دو کلاس دارد. یک بار هم از طبقه­بندی کننده SWLDA استفاده شد. در این روش، ابتدا هر دسته ویژگی با استفاده از تحلیل تفکیکی گام به گام و با معیار Wilk’s Lambda تحلیل و ویژگی‌های منتخب آن مشخص شد و سپس کار طبقه‌بندی با LDA صورت پذیرفت.

 

1-2- طبقه­بندی

 

هدف نهایی در هر مسأله شناسایی الگو، تفکیک مجموعه‍ای از نمونه­ها به دو یا چند کلاس مختلف است. در این جا هدف نهایی، تفکیک سیگنال­ها به دو گروه حاوی P300 و فاقد P300 است.  در این مقاله، از طبقه­بندی کننده­های SWLDA و LDA (که در کارهای قبلی هم نتایج خوبی با استفاده ازاین طبقه­بندی­کننده­ها گزارش شده بود)[29] استفاده شد.

LDA ساده­ترین و پرکاربردترین طبقه­بندی­کننده آماری است[29]. این طبقه­بندی­کننده در فرم استانداردش یک طبقه­بندی­کننده باینری است که با اعمال تخمین MAP[3] و با فرض گوسی بودن تابع توزیع احتمال شرطی ویژگی­ها در فضای ویژگی و همچنین تساوی ماتریس‍های کوواریانس کلاس­ها محاسبه می­شود.

طبقه­بندی­کننده SWLDA هم در واقع همان LDA است که قبل از انجام عملیات طبقه­بندی از یک روش پیشرو- پسرو برای انتخاب ویژگی استفاده می­کند. درشروع هیچ ویژگی­ای برای مدل در نظر گرفته نمی­شود و ویژگی‌ای که معیار ورود به سیستم را برآورده کند، به مدل اضافه می‌شود. پس از اضافه شدن هر ورودی جدید به مدل، یک روند بازگشتی گام به گامِ پسرو برای حذف ویژگی‌هایی که کمترین اهمیت را دارند، به کار می‌رود. این پروسه تا زمانی که مدل شامل تعداد ویژگی‌های از پیش تعیین شده بشود، یا تا زمانی که هیچ ویژگی اضافه‌ای نمانده باشد که معیار خروج / ورود را برآورده کند، ادامه می‌یابد.

 

2- نتایج

در این بخش نتایج کمّی به دست آمده در قسمت‌های مختلف، بیان شده، تحلیل‌های حاصل از آنها ارائه خواهد شد.

2-1- نتایج ارزیابی تکی ویژگی­ها با استفاده از معیارt

برای بررسی ویژگی­های مختلف و میزان تغییرات آنها در دو گروه مورد بررسی (هدف و غیرهدف)، در نخستین گام آزمون t-test برای تک تک ویژگی­ها اجرا شد. متغیرهای مورد بررسی در این ارزیابی، ویژگی­های استخراج شده از تک ثبت­ها بودند و کلاس­های مورد مقایسه، دو گروه حاوی P300 و فاقد P300 (هدف و غیرهدف) بودند.

دسته ویژگی قطعه­بندی هوشمند، شامل 70 ویژگی است به طوری­که برای هر کانال 10 ویژگی استخراج شده است. برای نمایش گویاتر نتایج، در شکل (4) نمودار ستونی قدرمطلق t-value برای ویژگی­های هر کانال تصویر شده است.

نتایج شکل (4) نشان می­دهد که در ارزیابی ویژگی‌های قطعه‍بندی هوشمند به صورت تک تک و با آزمون t-test، در اغلب کانال­ها ویژگی­های 3، 4 و 5 جزو ویژگی‌های برتر بوده­اند. از طرفی، با توجه به مرزهای حاصل از قطعه‌بندی، مشخص می‍شود که ویژگی­های 3، 4 و 5 مربوط به بازه زمانی 200 تا 508 میلی­ثانیه (محدوده رخداد مؤلفه P300) هستند.

همچنین، با بررسی الگوریتم LIR پیاده­سازی شده، مشخص شد که مرزهای ده قطعه حاصل بر حسب نمونه به صورت 0، 32، 42، 55، 91، 122، 146، 160، 166، 239 و 240 یا بر حسب زمان به صورت 0، 133، 200، 229، 379، 508، 608، 667، 692، 996 و 1000 میلی­ثانیه بوده است. در شکل (5) نمونه­ای از متوسط سیگنال­های هدف و غیرهدف، قبل و پس از قطعه­بندی هوشمند دیده می­شود.

با توجه به محل قرار گرفتن این مرزها، مشخص است که در قسمت­هایی که تفاوت شکل موج دو سیگنال هدف و غیر هدف بیشتر بوده، تعداد قطعه بیشتری تعریف شده است، اما در قسمت­هایی که این تفاوت کمتر است، قطعات کمتر با طول بیشتر لحاظ شده­اند.

 

 

 

شکل(4): مقادیر |t-value| برای 10 ویژگی قطعه­بندی هوشمند مربوط به هریک از هفت کانال انتخابی

 

 

 

شکل(5): بالا:متوسط کلیه سیگنال­های هدف قبل و پس از اعمال قطعه­بندی هوشمند در کانال Cz، پایین:متوسط کلیه سیگنال­های غیر هدف قبل و پس از اعمال قطعه­بندی هوشمند در کانال Cz

 

مثلاً در محدوده 133 تا 5/691 میلی ثانیه، که طبق تعاریف فیزیولوژیک سیگنال ERP، محل رخداد مؤلفه‌هایی از قبیل N100، P300 و N400 (مؤلفه­هایی که هنگام اعمال یک تحریک هدف رخ می­دهند) است، هفت قطعه تعریف شده، ولی در محدوده انتهایی سیگنال (692 تا 995 میلی ثانیه) تنها یک قطعه برای نشان دادن سیگنال به کار رفته است. به این ترتیب، با استفاده از این روش قطعه‍بندی هوشمند، می­توان بدون نگرانی از مشکلاتی مانند تعداد زیاد نمونه­ها و بالا رفتن بُعد بردار ویژگی، از مزایا و خواص مطلوب نمونه­های زمانی سیگنال استفاده و قسمت­های مهم سیگنال را بارزتر نمود. در شکل (5) هم این مسأله به شکل واضح­تر بر روی دو سیگنال هدف و غیر هدف و نتیجه اعمال قطعه­بندی بر روی آنها نشان داده شده است.

شکل (6) مقادیر قدرمطلق t-value را به صورت صعودی برای دسته ویژگی CSP نشان می­دهد. همان طور که در بخش 3-2 ذکر شد، این دسته ویژگی شامل دو نوع ویژگی است. نوع اول ویژگی‌های حاصل از فیلتر کردن داده­ها با فیلتر مکانی به دست آمده با روش CSP و نوع دوم ویژگی­های مبتنی بر واریانس، که طبق توضیحات قبلی برای هر ثبت، 96=24×4 ویژگی نوع اول و چهار ویژگی نوع دوم تعریف شد و به این طریق دسته ویژگی حاصل از CSP شامل 100 ویژگی شد. در ارزیابی ویژگی­های الگوی مکانی مشترک توسط آزمون t-test، در سه کانال از چهار کانال مورد استفاده در فضای CSP، ویژگی­های متعلق به بازه زمانی 542 -250 میلی­ثانیه (ویژگی­های 6 تا 13 هر کانال) ویژگی­های برتر بوده­اند که تشابه این محدوده زمانی در هر دو دسته ویژگی قطعه­بندی هوشمند و الگوهای مکانی مشترک، مؤید این مطلب است که در هر دو فضای دادگان خام و فضای CSP، ویژگی­های دو کلاس هدف و غیرهدف در بازه زمانی رخداد P300 تفاوت آشکاری با یکدیگر دارند و این بازه، بازه مناسبی برای استخراج ویژگی­های مؤثر و مفید در آشکارسازی P300 است. این ویژگی­ها در شکل (6) با رنگ سفید مشخص شده­اند و به وضوح مشخص است که تجمع آنها بیشتر در انتهای نمودار و مقادیر بیشتر |t-value| است.

 

 

 

شکل (6): مقادیر |t-value| برای دسته ویژگی الگوهای مکانی مشترک

 

 

در مورد این دسته ویژگی‌، ذکر این نکته هم مفید به نظر می­رسد که ویژگی­های مبتنی بر واریانس (که در شکل (6) با رنگ خاکستری مشخص شده­اند)، ویژگی­های مطلوبی نبوده­اند. البته، قبلاً هم ذکر شد که این ویژگی­ها بیشتر در سیستم­های BCI با کاربرد تصورات حرکتی استفاده می‌شوند. برای چنین سیستم­هایی که در آنها ویژگی­های اصلی توان­های باند μ و β هستند،  این نوع ویژگی­ها، ویژگی­های مناسبی هستند، ولی در بحث آشکارسازی P300 که مهمترین ویژگی­ها، ویژگی­های شکلی- زمانی هستند، نه واریانس سیگنال، بهتر است که از خود دادگان فیلتر شده به وسیله فیلترهای مکانی به عنوان ویژگی استفاده شود.

 

2-2- ارزیابی گروهی ویژگی­ها

 

معیار دوم برای ارزیابی دسته ویژگی­ها، مقایسه درصد صحت تفکیک آنها با یک طبقه­بندی­کننده است. در اینجا  از دو طبقه‍بندی کننده LDA و SWLDA استفاده شده است.ابتدا طبقه­بندی کننده خطی LDA بر هر دسته ویژگی اعمال و دقت با روش[4]LOO محاسبه شده است. در جدول (2) این نتایج برای دو سوژه A و B  و میانگین آن دو آورده شده است. بر اساس این نتایج، برای هر دو سوژه، قطعه­بندی هوشمند سیگنال به روش LIR بهترین کارایی را داشته است.

 

 

جدول (2): نتایج ارزیابی گروهی ویژگی­ها با استفاده از صحت طبقهبندیکننده LDA

درصد صحت

نوع ویژگی

بعد بردار ویژگی

سوژه

هدف

غیرهدف

میانگین

میانگین A و B

قطعه­بندی هوشمند

70

A

90%

8/94%

94%

05/95%

B

5/90%

2/97%

1/96%

CSP

100

A

1/77%

6/86%

85%

45/82%

B

4/72%

4/81%

9/79%

 

 

 

 

 

 

 

 

در مرتبه دوم، روش تحلیل تفکیکی گام به گام به کار گرفته شد. با استفاده از این روش، ابتدا در هر دسته ویژگی‌های برتر انتخاب شدند و سپس با طبقه­بندی­کننده SWLDA درصد صحت هر دسته محاسبه شد.

با اعمال این روشِ انتخاب ویژگی به دسته ویژگی اول، از میان 70 ویژگی قطعه­بندی هوشمند، 20 ویژگی انتخاب شدند که در این میان هم بیشتر ویژگی­ها در همان محدوده رخداد P300 قرار دارند. در مورد دسته ویژگی CSP هم از میان 26 ویژگی منتخب این دسته، در اغلب کانال­ها ویژگی‌های 5 تا 9 (مربوط به بازه 375- 208 میلی‍ثانیه) انتخاب شده­اند. بنابراین، هر دو روش t-test و تحلیل تفکیکی گام به گام، بیانگر اهمیت بازه رخداد مؤلفه P300 هستند.

در مورد میزان صحت حاصل توسط طبقه­بندی­کننده SWLDA هم در جدول (3) بعد بردار ویژگی و درصد صحت برای هر دسته ویژگی و برای هرکدام از دو سوژه و به صورت میانگین آمده است.

 

 

جدول (3): نتایج ارزیابی ویژگی­ها با روش تحلیل تفکیکی گام به گام و صحت طبقه­بندی­کننده SWLDA

درصد صحت

نوع ویژگی

بعد بردار ویژگی

سوژه

هدف

غیرهدف

میانگین

میانگین A و B

قطعه­بندی هوشمند

20

A

2/91%

3/95%

6/94%

25/95%

22

B

9/92%

5/96%

9/95%

CSP

26

A

9/82%

9/87%

1/87%

4/83%

28

B

5/76%

4/80%

7/79%

 

 

 

 

 

 

 

 

طبق جداول (2) و (3) دیده می­شود که نتایج حاصل از این دو طبقه‍بندی­کننده بسیار به هم نزدیک است، اما شاید بتوان حسن  SWLDAرا در تعداد ویژگی کمتر استفاده شده در آن دانست؛ مثلاً در مورد ویژگی‌های قطعه‌بندی هوشمند برای سوژه A، طبقه­بندی کننده LDA از 70 ویژگی استفاده کرده، ولی در SWLDA تنها از 20 ویژگی استفاده شده است که این مسأله پیچیدگی تابع تصمیم­گیری را کمتر کرده، تعمیم­پذیری طبقه­بندی­کننده را افزایش می­دهد. در واقع، برای حل مشکل LDA، روش SWLDA راه حلی ارائه داده است که با محدود کردن اندازه فضای ویژگی ورودی مشکل گستردگی ابعاد را برطرف کند. در این روش انتخاب ویژگی به صورت خودکار صورت می‌گیرد و جملات غیر مهم از مدل حذف می­شوند. همچنین، می­توان الگوریتم را به شیوه‌ای تنظیم کرد که سریعتر به همگرایی برسد

 

2-3- بررسی امکان تلفیق دو روش قطعه­بندی هوشمند و الگوهای مکانی مشترک

 

با توجه به آنچه تا کنون درباره دو دسته ویژگی قطعه‌بندی هوشمند و الگوهای مکانی مشترک گفته شد، این ایده به ذهن می­رسد که شاید ترکیب دو روش فوق به منظور ساخت یک دسته ویژگی ترکیبی مناسب باشد، زیرا همان طور که بیان شد، مزیت روش CSP در این است که در فضایی جدید، از تعداد کانال کمتری استفاده می­کند و حسن قطعه­بندی هوشمند هم در این است که با به کار گیری تعداد کمی نمونه به ازای هر کانال می­تواند به قدرت تفکیک بالایی در آشکارسازی P300 برسد، اما در روش قطعه­بندی از تعداد کانال زیادی استفاده شد که این امر حجم محاسبات را افزایش می­دهد، بنابراین، می­توان با ترکیب دو روش فوق، علاوه بر استفاده از مزایای دو روش، حجم محاسبات را هم کاهش داد. با این ایده دسته ویژگی ترکیبی CSP+LIR ساخته شد تا نتایج حاصل از آن نیز ارزیابی گردد.

برای ساخت این دسته ویژگی، ابتدا CSP در نقش یک کاهش دهنده بُعد ظاهر شده، دادگان را به فضایی جدید می‌برد که با وجود استفاده از تعداد کانال کمتر در آن فضا، قابلیت تفکیک زیادی از دست نمی­رود و در عین حال، از مزیت کاهش تعداد کانال­ها هم بهره برده می­شود. سپس با استفاده از روش قطعه­بندی هوشمند حجم دادگان را کاهش داده، دادگان بهینه­تری را انتخاب می­کنیم. با تکیه بر این ایده، این دسته ویژگی ترکیبی (با استفاده از همان پارامترهای به کار رفته در دو روش قطعه­بندی هوشمند و CSP) ساخته شد؛ یعنی با استفاده از تعداد قطعه بهینه محاسبه شده (k=10)، این روش ترکیبی شامل 40 ویژگی روی مجموع 4 کانالِ منتخب فضای جدید CSP است. نتایج ارزیابی این دسته ویژگی از دو دیدگاه تکی و گروهی در ادامه آمده است.

در ارزیابی تکی این ویژگی­ها با آزمون t-test دیده می‌شود که در این دسته ویژگی نیز، مشابه دسته ویژگی اول و دوم، ویژگی­های مربوط به بازه رخداد P300 (ویژگی­های 3 تا 6 هر کانال)ویژگی­های مناسبی بوده­اند و اختلاف آنها در دو کلاس مشهود بوده است. نمودار صعودی قدرمطلق مقادیر t-value برای ویژگی­های ترکیبی در شکل (7) (که ویژگی‌های3 تا 6 هر کانال در آن با رنگ سفید مشخص شده است) مؤید همین مطلب است. نتایج ارزیابی گروهی این دسته ویژگی با دو طبقه‌بندی‌کننده LDA و SWLDA در جدول (4) خلاصه شده است.

 

 

 

شکل(7): مقادیر |t-value| برای دسته ویژگی­ ترکیبی CSP+LIR

جدول(4): نتایج ارزیابی گروهی دسته ویژگی ترکیبی

درصد صحت

طبقه­بندی­کننده

بعد بردار ویژگی

سوژه

هدف

غیرهدف

میانگین

میانگین A و B

LDA

40

A

3/85%

2/86%

1/86%

2/85%

40

B

8/78%

4/85%

3/84%

SWLDA

18

A

1/84%

2/86%

9/85%

05/84%

17

B

8/78%

8/82%

2/82%

 

 

 

 

 

 

 

 

در دسته ویژگی ترکیبی، فرضیه اولیه این بود که با بهره­مندی از مزایای هر دو روش قبلی احتمالاً باید به نتایج برتری نسبت به هر دو روش به صورت مجزا، دست یافت، اما طبق جدول (4) دیده شد، که هرچند نتایج روش ترکیبی از روش CSP بهتر شد، اما باز هم ضعیفتر از روش قطعه‌بندی است. این مسأله نشان می‌دهد که به کارگیری قطعه‌بندی در فضای خام دادگان و روی تعداد کانال بیشتر، کارایی بهتری نسبت به اعمال آن در فضای جدید با تعداد کانال کمتر دارد.

یک مسأله جانبی دیگر در مورد ویژگی‌های انتخاب شده به روش تحلیل تفکیکی گام به گام است. دیده می‌شود که در این دسته ویژگی هم غالباً ویژگی­های مربوط به بازه رخداد P300 برگزیده شده­اند، به طوری که در بین 18 ویژگی انتخابی این دسته ویژگی، اکثر آنها (ویژگی­های 2 تا 6 در هر کانال­) در بازه زمانی 693- 147 میلی­ثانیه قرار می‌گیرند.

 

3- نتیجه‌گیری

 

در این مطالعه، تلاش بر این بود تا با استفاده از یک سیستم مبتنی بر بازشناسی الگو به آشکارسازی P300 پرداخته شود و ضمن آن، کارایی سه روش مختلف استخراج ویژگی هم بررسی شود. دسته ویژگی اول، ویژگی­های حاصل از قطعه­بندی هوشمند سیگنال بودند. قطعه­بندی، روش رایجی برای استخراج ویژگی در سیستم‌های بازشناسی الگوست، اما کاربرد آن در آشکارسازی مؤلفه P300 تا کنون بسیار کم بوده است. روش دوم هم استفاده از فیلتر کردن مکانی و الگوهای مکانی مشترک بود که هرچند در سایر حوزه­های BCI پرکاربرد بوده، اما ویژگی­های مستخرج از آن غالباً به گونه‌ای بوده‍اند(ویژگی­های مبتنی بر واریانس) که در سیستم­های مبتنی بر P300 توفیق چندانی نداشته­اند. در این مقاله سعی شد تا با تعریف نوع دیگری از ویژگی­های مبتنی بر CSP، کارایی هر دو نوع ویژگی در آشکارسازی P300 محک زده شود. در دسته ویژگی آخر هم از ترکیب دو روش استفاده شد تا از مزایای هر دو روش قبل بهره برده شود؛ یعنی هم با استفاده از CSP تعداد کانال­ها را کاهش داد و هم با روش قطعه­بندی هوشمند و کاهش نرخ نمونه‌برداری وفقی حجم محاسبات را کم کرد. بدین ترتیب، سه دسته ویژگی مختلف به دست آمد که با سه معیار t-test، استفاده از درصد صحت طبقه­بندی­کننده LDA و استفاده از روش SWLDA به ارزیابی آنها پرداخته شد که نتایج به دست آمده نشان دهنده برتری روش قطعه­بندی هوشمند نسبت به سایر روش‌ها بود؛ .به طوری که با هر دو طبقه‌بندی­کننده LDA و SWLDA بالاترین درصد صحت میانگین (25/95%) توسط این دسته ویژگی به دست آمد. این درصد صحت بالا بیانگر قدرت و توانایی این دسته ویژگی و اهمیت نحوه تقسیم‌بندی سیگنال است. برتری روش قطعه­بندی هوشمند نسبت به سایر روش­های کاهش نرخ نمونه­برداری در این است که این روش یک روش وفقی و آموزش‍پذیر است که سعی می­کند مرزهای قطعات را به نحوی تعیین کند که در عین زیاد کردن اختلاف بین دو کلاس، کمترین میزان اطلاعات از دست برود. همچنین، این روش کاهش نرخ نمونه­برداری این امکان را فراهم می‌کند تا از قسمت­هایی از سیگنال که اهمیت بیشتری دارد و حاوی اطلاعات بیشتری است، تعداد نمونه­های بیشتری ذخیره کرد و در عوض نمونه­های حفظ شده از قسمت­های کم اهمیت­تر را کاهش داد.

در مورد ویژگی­های CSP، هرچند ویژگی­هایی که از دادگان فیلتر شده به وسیله فیلتر مکانی تهیه شدند، به مراتب از ویژگی­های مبتنی بر واریانس بهتر بودند، اما بازهم کارایی روش قطعه­بندی هوشمند برتر از روش CSP است و این مسأله در نتایج حاصل از طبقه­بندی­کننده­ها به وضوح مشخص است.

آخرین نکته، از نتایج t-test به دست می­آید. طبق این نتایج در هر سه دسته ویژگی، ویژگی­هایی که متعلق به محدوده زمانی رخداد P300 هستند، دارای |t-value| بالایی هستند و قدرت تفکیک دو کلاس در آنها بالاست. این قضیه اهمیت بازه­زمانی رخداد P300 را بیش از پیش نمایان می­کند.  

در مقام قیاس با سایر مطالعات انجام گرفته در این زمینه نیز باید گفت که نتایج حاصل از این تحقیق، نتایج خوب و قابل قبولی هستند؛ برای مثال، می‌توان به کارهای افرادی مانندYang Liu ، Seller و یا Salvaris اشاره کرد که با روش­های مختلفی روی همین دادگان کار کرده­اند و نتایج ضعیف­تری به دست آورده­اند. همان­طور که در قسمت مقدمه هم ذکر شد؛  Yang Liuبا روش T-weighted، روی دادگان سال 2005 به صحت 90% در تشخیص کاراکتر رسید و یا Krusinski  و Sellers توانستند با حداکثر 60 ویژگی مدل،  به صحت 5/92%  روی این دادگان دست یابند. همچنین، بهترین صحت حاصل توسط Salvaris و همکارانش با استفاده از تبدیل موجک گسسته و طبقه‌بندی کننده FLD، صحت میانگین 95% بوده است، اما در این تحقیق ما توانستیم به صحت متوسط25/95% برسیم.



[1] Stepwise Linier Discriminant Analysis

[2] motor imagery

[3] Maximum A Posterior

[4] Leave One Out

[1]        س. رضانیا، ”کمی سازی پتانسیل های وابسته به رخداد(ERP) در فرایند حافظه اپیزودیک بر پایه ویژگی های زمان-فرکانس جدید،“ پایان ‌نامه کارشناسی ‌ارشد مهندسی پزشکی- بیوالکتریک، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، 87-1386.
[2]  J. Polich, “P300 in Clinical Applications,” in Electroencephalography: Basic Principles, Clinical Applications, and Related Fields, E. NiederMeyer and F. Lopes Da Silva, Eds., 4th ed.   Baltimore, Maryland: Lippincott Williams and Wilkins, 2000, ch. 58, pp. 1073-1091.
[3]    J. P. Rosenfeld, “Event-Related Potentials in the Detection of Deception, Malingering, and False Memories,” in Handbook of Polygraph Testing, M. Kleiner, Ed.  New York: Academic Press, 2002, ch. 10, pp. 265-286.
[4]    L. A. Farwell and E. Donchin, “The truth will out: Interrogative polygraphy (‘lie detection’) with event-related brain potentials,” Psychophysiology, vol. 28, no. 5, pp. 531-547, 1991.
[5]        و. ابوطالبی، ”تجزیه و تحلیل مؤلفه های شناختی سیگنال الکتریکی مغز و کاربرد آن در دروغ سنجی، “پایان ‌نامه دکترای مهندسی پزشکی- بیوالکتریک، دانشگاه صنعتی امیر کبیر، اردیبهشت 1385.
[6]  X. Neng, G. Xiaorong, H. Bo, M. Xiaobo, G. Shangkai, Y. Fusheng, "BCI competition 2003-data set IIb: enhancing P300 wave detection using ICA-based subspace projections for BCI applications," IEEE Trans. on Biomed. Eng., vol.51, no.6, pp.1067-1072, June 2004.
[7]  S.A. Markazia, L.K. Stergioulas, A. Ramchurn, D. Bunce, "Latency Corrected Wavelet Filtering of the P300 Event-Related Potential in Young and Old Adults," In Proc. 3rd IEEE EMBS Conf., Neural Eng., CNE '07. ,  pp.582-586, 2-5 May 2007.
[8]  M. Kaper, P. Meinicke, U. Grossekathoefer, T. Lingner, H. Ritter, "BCI competition 2003-data set IIb: support vector machines for the P300 speller paradigm," IEEE Trans. on Biomed. Eng., vol.51, no.6, pp.1073-1076, June 2004.
[9]  BCI Competition 2005. ida.first.fraunhofer.de/projects/bci/competition_ii
[10] U. Hoffmann, G. Garcia, J.-M. Vesin, K. Diserens, T. Ebrahimi, "A Boosting Approach to P300 Detection with Application to Brain-Computer Interfaces," In Proc. 2nd IEEE EMBS Conf.on Neural Eng., 2005., pp.97-100, 16-19 March 2005.
[11] L. Yang, Z. Zongtan, H. Dewen, D. Guohua, "T-weighted Approach for Neural Information Processing in P300 based Brain-Computer Interface," Int. Conf. on Neural Net. and Brain, 2005. ICNN&B '05., vol.3,  pp.1535-1539, 13-15 Oct. 2005.
[12] D.J. Krusienski, E.W. Sellers, D.J. McFarland, T.M. Vaughan, J.R. Wolpaw, “Toward enhanced P300 speller performance,” J. Neuroscience Methods , Vol. 167, pp.15-21, 2008.
[13] M. Salvaris, F. Sepulveda, "Wavelets and ensemble of FLDs for P300 classification," 4th Int. IEEE/EMBS Conf. on Neural Eng., 2009. NER '09. vol., no., pp.339-342, April 29 2009-May 2 2009.
[14]     ف. عطری، “استخراج و پردازش سیگنال­های EEG متاثر از بیوفیدبک جهت ارسال کاراکترهای مورد توجه شخص به کامپیوتر،” پایان نامه کارشناسی‌ ارشد مهندسی پزشکی-بیوالکتریک، دانشگاه تهران، شهریور 1384.
[15] Z. Seyyedsalehi, A.M. Nasrabadi, V. Abootalebi, “Committee Machines and Quadratic B-spline Wavelet for the P300 Speller Paradigm,” IEEE/ACS Conf. on Comp. Sys. And Appl., pp.866-869, 2008.
[16] T. Pavlidis, “Algorithm for Shape Analysis and Waveforms,” IEEE Trans. on Pattern Analysis and Machine Intelligence, PAMI- 2(4): pp.301-312, 1980.
[17] T. Rohlfing, D.B. Russakoff, and C.R. Maurer, “Performance-Based Classifier Combination in Atlas-Based Image Segmentation Using Expectation-Maximization Parameter Estimation,” IEEE Trans. on Med. Imag., vol.23, no.8, pp.983-994, Aug. 2004.
[18] T. Pavlidis, “Waveform Segmentation Through Functional Approximation,” IEEE Trans. on Comp., C- 22(7): pp.689-697, 1973.
[19] A. Rakotomamonjy, V. Guigue, "BCI Competition III: Dataset II- Ensemble of SVMs for BCI P300 Speller," IEEE Trans.on Biomed. Eng., vol.55, no.3, pp.1147-1154, March 2008.
[20] A. Combaz1, N.V. Manyakov, N. Chumerin1, J. A. K. Suykens, M. M. Van Hulle, “Feature Extraction and Classification of EEG Signals for Rapid P300 Mind spelling,”  IEEE Int. Conf. on Machine Learning and Appl., pp.386-391, 2009.
[21] Y. Sakamoto and M. Aono, “Supervised Adaptive Downsampling for P300-based Brain Computer Interface,” 31st Int. Conf. on IEEE EMBS, pp.567-570, September 2-6, 2009.
[22] D. H. Foley, J. W. Sammon Jr., “An Optimal Set of Discriminant Vectors,” IEEE Trans. on Comp., Vol.24, No.3, pp.281-289, March 1975.
[23] A. Soong and Z. Koles, “Principal-component localization of the sources of the background eeg,” IEEE Trans. on Biomed. Eng., vol. 42, no. 1, pp. 59–67, Jan. 1995.
[24] K. Fukunaga, “Introduction to Statistical Pattern Recognition,” Second Edition. Morgan Kaufmann - Academic Press, 1990.
[25] D.J. Krusienski, E.W. Sellers, T.M. Vaughan, "Common Spatio-Temporal Patterns for the P300 Speller," 3rd Int. IEEE/EMBS Conf. on Neural Eng., 2007. CNE '07, vol., no., pp.421-424, 2-5 May 2007.
[26] R. Li, A.Keil, J.C. Principe, “Single-trial P300 estimation with a spatiotemporal filtering method,” J. Neuroscience Methods, vol.177 ,pp.488-496, 2009.
[27] B. Rivet, H. Cecotti, R. Phlypo, O. Bertrand, E. Maby, J. Mattout, “EEG sensor selection by sparse spatial filering in P300 speller brain-computer interface,” 32nd Int. IEEE  EMBC Conf., pp. 5379-5382, Agu. 31- Sep. 4,2010.
[28] G. Pires, U. Nunes, M. Castelo-Branco, "P300 spatial filtering and coherence-based channel selection," 4th IEEE EMBS Conf. on Neural Eng., NER '09., pp.311-314, April 29 2009-May 2 2009.
[29]  D. J. Krusienski, E.W. Sellers, F. ois Cabestaing, S. Bayoudh, D. J McFarland, T. M Vaughan and J. RWolpaw, “A comparison of classification techniques for the P300 Speller,” J. Neural Eng.,vol.3, pp.299-305, 2006.