Neuro-Terminal Sliding Control in arm movement using online routing algorithm

Document Type : Research Article

Authors

1 1-1-1- Iran University of Science & Technology

2 shahed university

Abstract

To control 3-DOF model of human arm movement in page and to reach robust control in external disturbance, unmodeled dynamics and uncertainties of model with time-varying properties, continues terminal sliding mode control as an adaptive-robust control was used. This controller have exponential convergence to zero tracing error, but chattering phenomenon in sliding control isn’t decrease desirable. In this paper, to decrease chattering, we coupled a recurrent neural network by a single hidden layer into the terminal sliding control (TSM). Moreover, because of systematic redundancy in the model of arm, don’t exist unique joint trajectories to considering as a default, so to reach online desired trajectories in reaching, online routing algorithm was used with Neuro-TSM control. For testing the robustness in control, we applied disturbance signals of torque. The results have shown,Neuro-TSM along with online routing algorithm, in addition to reducing chattering, could track joint trajectories and end effector path with very low errors.

Keywords


در سیستم­های تحریک الکتریکی عملکردی، به‌منظور بازیابی حرکت­های محدود در اندام­های فلج، به دلیل ماهیت به‌شدت غیرخطی سیستم و نیز عدم قطعیت­ها و تغییرات روزبه‌روز و فردبه‌فرد در پارامترهای سیستم، کنترل ترمینال پیوسته لغزشی ازجمله کنترل­های مقاوم و تطبیقی قدرتمند به‌حساب می­آید. این کنترل‌کننده با سوئیچینگ فرکانس بالا امکان ردیابی مسیرهای مطلوب با دقت بسیار بالایی را فراهم می­کند اما از طرفی پدیده چترینگ را نیز افزایش می­دهد.

وجود چترینگ در کنترل، تحریک دینامیک­های فرکانس بالای مدل نشده سیستم را باعث شده که درنهایت منجر به ناپایداری غیرقابل‌پیش‌بینی می­شود [1]؛ بنابراین جهت عملکرد بهتر کنترل‌کننده باید چترینگ تا حد ممکن کاهش داده شود.

در کنترل‌کننده مد لغزشی کلاسیک، با تعریف یک قانون کنترل پیوسته به‌جای کنترل گسسته درون یک‌لایه مرزی در همسایگی سطح لغزش تا حدی پدیده چترینگ کاهش داده‌شده است. در این روش در تعیین ضخامت لایه‌مرزی، می­بایست بین خطای ردیابی مسیر و نیز کاهش چترینگ مصالحه­ای صورت گیرد. در این مورد روش شایع جایگزین کردن تابع پیوسته از نوع تقریب اشباع[1] درون لایه‌مرزی حول سطح لغزش است. این روش اگرچه پدیده چترینگ را کاهش می­دهد، همگرایی به سطح لغزش را ضمانت نمی­کند و ضمن ایجاد مصالحه بین خطای ردیابی و کاهش چترینگ، منجر به ایجاد خطای حالت پایدار می­شود [2]. در [3] کنترل مد لغزشی کلاسیک با لایه‌مرزی [2]، جهت کنترل مفصل زانو مورداستفاده قرارگرفته است که مشکل چترینگ همچنان وجود دارد و در عین حال دقت ردیابی مسیر در آن پایین بوده است.

جزرنیک[2] و همکارانش [4] کنترل‌کننده حلقه بسته مد لغزشی را برای کنترل مفصل زانو بکار برده­اند که در آن به‌جای عبارت گسسته ksgn(s)(تابع sign که به ازای ورودی‌های بزرگ‌تر از صفر یک و به ازای ورودی‌های کوچک‌تر از صفر، منفی یک هست) یک عبارت پیوسته ks را در قانون کنترل جایگزین کرده­اند؛ اما در این مورد، همگرایی به سمت صفر در زمان محدود از متغیر لغزش، تضمین نمی­شود و شرط η-reachability نقض خواهد شد. کبروی و عرفانیان [1] کنترل مد لغزشی کلاسیک را به همراه کنترل جبران‌کننده غیرخطی تطبیقی[3] به‌عنوان ورودی کنترل کمکی ارائه نموده‌اند. آن­ها با تعیین یک ضخامت لایه‌مرزی، تابعی از انتخاب هر دو قانون کنترلی را تعریف نموده­اند بدین‌صورت که درون لایه‌مرزی تأثیر کنترل جبران‌کننده تطبیقی، بیشتر از قانون کنترل مد لغزشی است. با این روش در همسایگی­ای از سطح لغزش پدیده چترینگ کاهش‌یافته است. کنترل جبران‌کننده تطبیقی بدون هرگونه آزمایش اولیه­ای به‌صورت برخط تطبیق‌پذیر است. درواقع با تعریف یک تابع لیاپانوف، قوانین تطبیقی جهت همگرایی خطای مسیریابی به سمت صفر حاصل‌شده‌اند.

 آجودانی و عرفانیان [5] جهت کاهش پدیده چترینگ در کنترل مد لغزشی کلاسیک، یک شبکه پرسپترون بازگشتی با یک‌لایه پنهان ارائه کرده­اند که به‌صورت برخط آموزش داده می­شود. با تعیین لایه‌مرزی، انتخابی بین دو کنترل لغزشی و شبکه پرسپترون صورت می‌گیرد. پارامترهای شبکه پرسپترون تک لایه با قوانین تطبیقی حاصل‌شده بر پایه تعریف تابع لیاپانوف به‌صورت برخط تعیین می­شوند. در این مقاله شبکه پرسپترون بازگشتی با یک‌لایه پنهان [5] همراه با کنترل تطبیقی ترمینال پیوسته لغزشی [6] جهت کاهش چترینگ، برای کنترل حرکت مدل سه لینکه از بازوی انسان بکار رفته است.

از طرفی با در نظر گرفتن حرکت در صفحه، افزونگی سینماتیکی در مدل با سه درجه آزادی حاصل خواهد شد که به ایجاد مسیرهای متعدد برای یک کار خاص منجر می­شود؛ بنابراین روش­های بهینه­سازی جهت ایجاد مسیرهای واحد در هر حرکت مطرح‌شده‌اند. طی چند دهه گذشته مسائل QP[4] در حکم توابع هزینه برای بهینه­سازی و تولید مسیرهای مطلوب، جهت کنترل ربات و آنالیز حرکت انسان موردبررسی قرارگرفته‌اند. تعدادی حل‌کننده‌های دینامیکی بر پایه شبکه­های عصبی بازگشتی توسعه‌یافته‌اند که ازجمله آ­ن­ها می­توان به شبکه­های عصبی primal-dual معمول و شبکه عصبی dual اشاره کرد [7]. روش عصبی-دینامیکی به‌عنوان یک حل­کننده[5] دینامیکی برخط و قدرتمند توسعه داده‌شده است. زهانگ و همکارانش [9-7] با تبدیل مسئله بهینه‌سازی QP به یک نامساوی تغییرپذیر خطی[6]، روش primal-dual را برای یک حل برخط با استفاده از شبکه‌های عصبی بازگشتی پیشنهاد داده­اند.

در بهینه­سازی مسائل QP، شبکه عصبی برای حل نامساوی تغییرپذیر خطی به روش primal-dual، LVI-PDNN[7]، با دارا بودن دینامیک­های تکه‌ای‌خطی،، در مقایسه با دیگر حل­کننده­های شبکه­های عصبی، به‌طور نمایی به پاسخ بهینه همگرا است. همچنین باوجود شبکه تک لایه پنهان و بدون نیاز به هرگونه معکوس گیری از ماتریس ضرایب در حل کلاسیک مسئله بهینه‌سازی QP، مشکل پیچیدگی محاسباتی روش­های مربوطه را ندارد. در بین این ویژگی­ها، ویژگی همگرایی به حل بهینه به‌طور نمایی، این روش را بسیار کاربردی می­نماید [10].

ما در این تحقیق، مسئله QP را به‌صورت حداقل انرژی جنبشی در نظر گرفته­ایم که با روش بهینه­سازی برخط LVI-PDNN مسیرهای مطلوب در فضای مفصل را محاسبه می­نماییم. کنترل ترمینال لغزشی با شبکه عصبی پرسپترون تک لایه پنهان جهت کاهش پدیده چترینگ در آن، برای کنترل حرکت بازو از یک مدل سه لینکه (سه درجه آزادی حرکت در صفحه ساجیتال) به همراه الگوریتم بهینه­سازی برخط LVI-PDNN بکار رفته است. چارچوب عملکردی این مقاله در شکل (1) نشان داده‌شده است.

پارامترهای مدل اسکلتی بازو، از [11] به‌دست‌آمده‌اند و نیز طبق [12] ماهیچه­ها جهت تولید گشتاورهای لازم در مفاصل مدل شده‌اند.

 

 

شکل (1): بلوک دیاگرام از عملکرد کلی مقاله

 

 

1- مدل عضلانی- اسکلتی بازو

بازوی انسان در دو ساختار کلی، دینامیک‌های ماهیچه‌ای و دینامیک‌های اسکلتی، به‌صورت سه لینکه با سه درجه آزادی، برای حرکت در صفحه ساجیتال مدل شده است. مدل ماهیچه مطابق با مقاله [12]، شامل دینامیک‌های انقباض، رابطه نیرو-طول، نیرو سرعت و نیز منحنی غیرخطی به‌کارگیری[8] ماهیچه‌ها را با هر تحریک عصبی، شامل می‌شود. امپدانس غیرفعال مفصل مربوط به خاصیت جرم- فنر-دمپر مفصل-عضله مدل نشده است. در این مدل، خروجی مستقیماً برحسب گشتاور به دست می‌آید. معادله حرکت در صفحه ساجیتال نیز، بر اساس معادله لاگرانژ برای دینامیک حرکت، محاسبه‌شده است. این معادله برحسب مجموع انرژی جنبشی و پتانسیل هر مفصل است که با مشتق‌گیری نسبت به موقعیت و سرعت زاویه‌ای و نیز نسبت به زمان، معادله‌ای برحسب موقعیت، سرعت و شتاب زاویه‌ای با ورودی‌های گشتاور هر مفصل حاصل می‌شود.

 

2- مسیریابی برخط LVI-PDNN

در این تحقیق، حرکت دست رسانی از بازوی انسان به‌عنوان یک کار خاص در نظر گرفته‌شده است. بر اساس مطالعات انجام‌شده مسیرهای عملگرنهایی در دست رسانی، به‌صورت مسیرهای تکه‌ای‌خطی با ویژگی­های سرعت زنگوله­ای شکل در کل مسیر به سمت موقعیت هدف، به‌دست‌آمده‌اند [13]. بر این اساس، مسیر مستقیم­الخطی از عملگر نهایی را به‌عنوان مسیری در فضای کاری در نظر گرفته­ایم.

مسیر مستقیم­الخط، مختصات x,y در فضای کاری عملگر نهایی را به الگوریتم بهینه­سازی برخط LVI-PDNN می­دهد. با تعریف تابع هزینه QP به‌صورت حداقل انرژی جنبشی، از فضای کار به فضای مفاصل، مسیرهای مطلوب مفاصل شانه، آرنج و مچ به دست می­آیند.

با در نظر گرفتن معادله حرکت نیوتن اویلر، دینامیک حرکت ساختار اسکلتی، به‌صورت زیر تعریف می­شود.

(1)

 

 

H ماتریس اینرسی، C ماتریس نیروهای کوریولیس و گریز از مرکز[9] و g ماتریس جاذبه است.τ بردار گشتاورهای تولیدشده از ماهیچه­ها است و ،  و  به ترتیب بردارهای موقعیت، سرعت و شتاب زاویه­ای مفاصل می‌باشند. مسائل QP [8] در دو شما تیک سطح سرعت و شتاب در نظر گرفته می­شوند که هر دو در فرم کلی به‌صورت زیر تعریف می­شوند.

(2)

 

 

x به‌عنوان بردار تصمیم در شما تیک­ سطح سرعت  و در شما تیک سطح شتاب  است. ماتریس­های ضرایب W، b، d و نیز محدودیت­های فیزیکی زوایا بر اساس نوع تابع هزینه جهت بهینه­سازی به‌وسیله ماتریس­های معادله حرکت نیوتن اویلر تعریف می­شوند. در این تحقیق با در نظر گرفتن تابع هزینه حداقل انرژی جنبشی، ماتریس­های ضرایب معادله (2) به‌صورت زیر محاسبه می­شوند.

(3)

 

 

 و  برای حفظ محدودیت­های فیزیکی تعریف‌شده‌اند.w و b ماتریس‌های وزن متغیرهای تصمیم‌گیری در تابع هزینه و مستقل از می‌باشند و r مسیر مطلوب برای عملگرنهایی است. با تعریف مسئله QP، سیستم دینامیکی LVI از یک مدل افزوده با اضافه کردن یک ثابت بزرگ y، بردار متغیر تصمیم‌گیری جدیدی به‌صورت زیر تعریف می­کند.

(4)

 

 

در این تحقیق x همان  است. به ازای هر i، المان‌های  ثابت­های به‌اندازه کافی بزرگ هستند. با تعریف مجموعه ، ماتریس­ها و بردارهای ضرایب به‌صورت معادله زیر حاصل‌شده‌اند.

(5)

 

 

J ماتریس تبدیل از فضای مفصل به فضای کار در مختصات x,y از صفحه حرکت ساجیتال است. حل مسئله QP معادل با مسئله LVI معادله (6) است که با برقراری شرط موجود در زیر به دنبال یافتن است.

(6)

 

 

این شرط با معادله تکه‌ای‌خطی (7) معادل است که  به‌صورت و دارای تابع تکه‌ای‌خطی تعریف‌شده زیر است.

(7)

 

 

معادله نهایی حاصل به‌وسیله معادله دینامیکی زیر به‌صورت برخط محاسبه می­شود.

(8)

 

 

پارامتر طراحی است که نرخ همگرایی سیستم دینامیک را تعیین می­کند. تمام معادلات ذکرشده در بالا در ساختار شبکه عصبی به‌صورت معادله زیر تعریف می­شوند.

(9)

 

در این رابطه مؤلفه ij آم از  است و مؤلفه ik آم از ماتریس  و بردار  نیز همان بردار  در معادله (5) می‌باشند.

3- کنترل ترکیبی فازی-تطبیقی ترمینال لغزشی به همراه شبکه عصبی پرسپترون

کنترل مد لغزشی، ازجمله کنترل­کننده­های مقاوم در برابر دینامیک­های مدل نشده سیستم­های به‌شدت غیرخطی و نیز اغتشاشات محدود محیطی، در دو مد کلاسیک و ترمینال طراحی‌شده است. در مد کلاسیک، زمان نامحدود همگرایی خطای ردیابی به سمت صفر و نیز چترینگ بالای آن در ردیابی مسیر از مشکلات اساسی کنترل‌کننده است. کنترل ترمینال، باهدف ایجاد زمان همگرایی محدود، خطای ردیابی به سمت صفر و نیز کاهش پدیده چترینگ طراحی‌شده است. برای دستیابی به خطای ردیابی بسیار کم، فرکانس بالای تحریک موردنیاز است که این امر چترینگ را افزایش می­دهد. درحرکت موردنظر reaching که یک حرکت هدفمند به سمت نقطه­ای مشخص از هر نقطه شروع اولیه­ای به‌حساب می­آید، میزان خطای ردیابی مسیر بسیار حائز اهمیت است. ازاین‌رو، به فرکانس بالای تحریک نیاز است که در مقابل با افزایش میزان چترینگ همراه می­شود. این امر در کاربردهای عملی باعث تحریک دینامیک­های فرکانس بالای مدل نشده از سیستم و درنتیجه ناپایداری غیرقابل پیشگوئی می­گردد. آجودانی و عرفانیان [5] یک شبکه عصبی بازگشتی تک لایه پنهان پرسپترون به همراه کنترل لغزشی مد کلاسیک ارائه داده­اند. ما در این تحقیق، ترکیب کنترل ترمینال پیوسته لغزشی[6]، جهت ایجاد زمان همگرایی محدود به سمت خطای ردیابی صفر و شبکه عصبی پرسپترون[5]، جهت کاهش چترینگ موجود در تحریک فرکانس بالا را در ایجاد خطای ردیابی بسیار جزئی بکار گرفته­ایم. ساختار ترکیبی کنترل شبکه عصبی و کنترل ترمینال لغزشی به‌صورت شما تیکی در شکل (3) نشان داده‌شده است. سطح لغزش کنترل ترمینال با رابطه غیرخطی معادله (10) تعریف می­شود [6].

(10)

 

 

 

 

 

شکل (3): ساختار شما تیکی ترکیب دو کنترل‌کننده ترمینال لغزشی و شبکه عصبی پرسپترون

 

 

که و  و  سیگنال خطای ردیابی مسیر مطلوب است. با تعریف دینامیک رسیدن به سطح لغزش، خروجی کنترل ترمینال، u1، از رابطه زیر به دست می­آید.

(11)

 

 

مجموع دو عبارت آخر سمت چپ معادله (10) قانون رسیدن به سطح لغزش کنترل ترمینال است. توابع غیرخطی F(θ,t) و  در دینامیک حرکت زیر تعریف‌شده‌اند که در عمل ناشناخته­اند.

(12)

 

 

این توابع غیرخطی ناشناخته بر اساس سیستم­های فازی و قوانین ضرب­– استنتاج، فازی کننده تکین و غیر فازی کننده مرکز­–­ میانگین، به‌صورت معادله (13) تخمین زده می­شوند.

(13)

 

 

که  تعداد کل قوانین فازی است،  نقطه­ای است که در آن تابع عضویت برابر یک می‌شود و  تابع عضویت از متغیر فازی  است که توسط تابع گوسی توصیف‌شده است. همچنین  است و بردار  در معادله (14) تعریف‌شده است.

(14)

 

 

برای تخمین توابع غیرخطی  و  در دینامیک حرکت، قوانین تطبیقی برای تنظیم پارامترهای  و  بر پایه نظریه پایداری لیاپانوف به­صورت بر­خط، طبق معادله (17) ارائه‌شده‌اند.

(15)

 

 

که  و  (برای جزئیات بیشتر به [7] مراجعه شود).

 

3-1- شبکه عصبی تک لایه پنهان پرسپترون

ساختار شبکه تک لایه [6] استفاده‌شده است. خروجی کنترل‌کننده شبکه عصبی به‌صورت زیر تعریف‌شده است.

(16)

 

 

که خطای حالت و آستانه تحریک نرون است و net ورودی نرون را نشان می­دهد. برای تطبیق برخط پارامترهای شبکه،  تابع لیاپانوف تعریف‌شده است. هدف کنترل مینیمم کردن E با تطبیق پارامترهای شبکه عصبی است. بر اساس قانون یادگیری BP[x]، قانون تطبیق پارامترها به‌صورت معادله زیر است.

(17)

 

 

که پارامتر نرخ یادگیری و sgn(.) همان تابع نرون در شبکه پرسپترون است.

 

3-2- قانون تصمیم

قانون تصمیم به‌صورت تابع چند ضابطه­ای از خروجی‌های هر دو کنترل‌کننده تعریف‌شده است. مطابق شکل (3) خروجی­های هر دو کنترل‌کننده ترمینال لغزشی و شبکه عصبی به ترتیب با u1 و u2 نشان داده‌شده‌اند که طبق معادلات (11) و (16) به‌دست‌آمده‌اند و با تعریف لایه‌مرزی به ضخامت  تابع تصمیم دو ضابطه­ای زیر تعریف‌شده است.

(18)

 

 

S(e) طبق معادله (10) به دست می­آید و تابعی از خطا با معادله زیر تطبیق داده می­شود.

(19)

 

 

4- نتایج

این تحقیق باهدف کنترل حرکت بازوی انسان با سه درجه آزادی در سیمولینک Matlab R2012b پیاده‌سازی شده است. پارامترهای مدل اسکلتی سه لینکه بازو شامل طول، جرم و اینرسی هر لینک مطابق [11] برابر L1=0.33m، L2=0.4m،L3=0.15m،m1=2.52kg،m2=1.3kg،m3=0.49k،I1=0.023kg.m2،I2=0.011kg.m2 و I3=0.001kg.m2 در نظر گرفته‌شده‌اند. فضای کاری برای عملگرنهایی برای حرکت در صفحه، دایره­ای به شعاع مجموع طول هر سه لینک یعنی L3+L1+L2 است. محدودیت­های فیزیکی مفاصل نیز مطابق [14] به‌صورت [180 و 60-]θ1=، [180 و 75-] θ2=، [45 و 15-] θ3=درجه به ترتیب برای مفصل شانه، آرنج و مچ در نظر گرفته‌شده‌اند. حرکت دست رسانی در این فضای کاری در کمتر از یک ثانیه انجام می­شود. پارامتر γ در الگوریتم LVI-PDNN نرخ همگرایی به حل بهینه را تعیین می­کند، بنابراین باید به‌اندازه کافی بزرگ انتخاب شود تا در کمتر از یک ثانیه، مسیر تعیین‌شده برای عملگر نهایی از هر نقطه شروع به هر نقطه پایانی به‌طور کامل پیموده شود و در این صورت باید مسیرهای مطلوب در فضای مفاصل به‌صورت برخط تعیین گردند. پارامترهای الگوریتم مسیریابی برخط به‌صورت 20 ، 0.9 و 107  در نظر گرفته‌شده‌اند. کنترل‌کننده ترمینال نیز باوجود زمان همگرایی مطلوب با انتخاب پارامترهای کنترلی­(0.009 و 0.009 و 0.009) ،k1=k2=diag(10000)، 1.9 و 0.01  الگوهای تحریک به عضلات را برای کنترل حرکت مطلوب تولید می­کند. پریود پالس تحریک 0.001 ثانیه انتخاب‌شده تا خطای ردیابی مسیرهای مطلوب در حد بسیار کمی کاهش یابد. مسیر خط مستقیم در فضای کاری عملگرنهایی به ترتیب از نقاط شروع (0.6113 و 0.5926)(x0,y0)= و پایان (0.3740 و 0.7901)(xf,yf)= در نظر گرفته‌شده که در شکل (4) نشان داده‌شده است.

 

 

شکل (4): data1 مسیر بازیابی شده توسط سینماتیک مستقیم بر روی زوایای مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN، data2 مسیر مستقیم‌الخط تعریف‌شده برای عملگر نهایی، data3 نقطه پایان و data4 نقطه شروع را نشان می­دهند.

 

با اعمال سینماتیک مستقیم روی مسیرهای مطلوب به‌دست‌آمده در فضای مفاصل، مسیر عملگرنهایی را در فضای کار بازیابی نموده­ایم. نتیجه نشان داد که مسیر مستقیم‌الخط از پیش تعیین‌شده برای عملگر نهایی با خطای کمتر از 4-10 بازیابی شده است که معیاری در عملکرد بسیار مطلوب الگوریتم LVI-PDNN در تولید برخط مسیرهای مطلوب در فضای مفاصل است. در این تحقیق یک‌بار کنترل‌کننده ترمینال لغزشی را به‌طور مجزا با الگوریتم مسیریابی برخط جهت کنترل حرکت مدل بازو با سه درجه آزادی بکار برده­ایم. نتایج حاصل از ردیابی مسیرهای مطلوب زوایا و خطاهای هریک به همراه خطای بازیابی مسیر عملگر نهایی از خروجی­های مفاصل مدل کنترل‌شده به ترتیب در شکل­های (11-5) نشان داده‌شده‌اند.

 

شکل (5): data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال مجزا را برای مفصل شانه نشان می­دهند.

 

شکل (6): data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال مجزا را برای مفصل آرنج نشان می­دهند.

 

شکل (7): data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال مجزا را برای مفصل مچ نشان می­دهند.

 

شکل (8): خطای ردیابی مسیر مطلوب مفصل شانه را برحسب درجه نشان می­دهد.

 

شکل (9): خطای ردیابی مسیر مطلوب مفصل آرنج را برحسب درجه نشان می­دهد.

 

شکل (10): خطای ردیابی مسیر مطلوب مفصل مچ را برحسب درجه نشان می­دهد.

 

شکل (11): خطای بازیابی مسیر عملگرهایی را در هر دو مختصات x,y نشان می­دهد.

 

در بررسی میزان چترینگ در اعمال کنترل ترمینال لغزشی به‌طور مجزا و با فرکانس تحریک بالا جهت کاهش خطای ردیابی، گشتاورهای خروجی از جفت ماهیچه­های موافق و مخالف هر سه مفصل در شکل (12) نشان داده‌شده‌اند. هر سه در کمتر از 70± (Nm) دارای تغییرات هستند.

 

 

شکل (12): سیگنال­های گشتاور تولیدشده از عضلات را برای سه مفصل شانه، آرنج و مچ به ترتیب از بالا تا پایین نشان می­دهد.

 

ماکسیمم پهنای پالس تحریک 100 میکروثانیه در نظر گرفته‌شده و ازآنجاکه پهنای پالس منفی معنی ندارد، بنابراین سیگنال­های پهنای پالس تحریک بین صفر و 100 میکروثانیه تغییرات دارند. برای کاهش چت رینگ موجود که به دلیل در نظر گرفتن فرکانس بالای تحریک جهت کاهش میزان خطای ردیابی، حاصل‌شده است، کنترل شبکه عصبی بازگشتی و تک لایه پنهان پرسپترون را همان‌طور که در بخش­های (3-1) و (3-2) توضیح داده­ایم همراه با کنترل ترمینال لغزشی بکار گرفته­ایم. ازآنجاکه با روش لایه‌مرزی کاهش میزان چترینگ، افزایشی را در خطای ردیابی به وجود می­آورد، می­بایست مصالحه­ای بین این دو صورت گیرد. در این تحقیق ضخامت لایه‌مرزی بر اساس سعی و خطا در این مصالحه،  در نظر گرفته‌شده است که گشتاورهای به‌دست‌آمده از ماهیچه­های موافق و مخالف برای هر سه مفصل، مسیرهای مفاصل از مدل کنترل‌شده به همراه مسیرهای مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN به‌صورت برخط و نیز میزان خطاهای ردیابی مسیرهای مطلوب مفاصل در شکل­های (19-13) نشان داده‌شده‌اند.

 

 

شکل (13): گشتاورهای حاصل از کنترل ترکیبی ترمینال و شبکه عصبی را در هر سه مفصل شانه، آرنج و مچ به ترتیب از بالا به پایین نشان می­دهد.

 

شکل (14): data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال-شبکه عصبی را برای مفصل شانه نشان می­دهند.

 

شکل (15):data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال-شبکه عصبی را برای مفصل آرنج نشان می­دهند.

 

شکل (16): data1 مسیر مطلوب به‌دست‌آمده از الگوریتم LVI-PDNN و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل ترمینال-شبکه عصبی را برای مفصل مچ نشان می­دهند.

 

شکل (17): خطای ردیابی مسیر مطلوب مفصل شانه را برحسب درجه نشان می­دهد. (به هنگام اعمال کنترل ترکیبی ترمینال و شبکه عصبی)

 

شکل (18): خطای ردیابی مسیر مطلوب مفصل آرنج را برحسب درجه نشان می­دهد. (به هنگام اعمال کنترل ترکیبی ترمینال و شبکه عصبی)

 

شکل (19): خطای ردیابی مسیر مطلوب مفصل مچ را برحسب درجه نشان می­دهد. (به هنگام اعمال کنترل ترکیبی ترمینال و شبکه عصبی)

 

همان‌طور که شکل­ها نشان می­دهند چترینگ به میزان مطلوبی کاهش‌یافته است و در مقابل خطاهای ردیابی نیز به میزان کمی افزایش پیداکرده‌اند که با اعمال سینماتیک مستقیم بر روی مسیرهای به‌دست‌آمده از مفاصل، مسیر عملگر نهایی را بازیابی نموده­ایم و خطاهای بازیابی از مسیر عملگر نهایی در هر دو مختصات x,y به‌طور مطلوب در کمتر از یک سانتی­متر انحراف از مسیر، مطابق شکل (20) حاصل‌شده‌اند.

 

شکل (20): خطای بازیابی مسیر عملگرنهایی را در هر دو مختصات x,y در زمان به‌کارگیری روش لایه‌مرزی نشان می‌دهد.

این میزان خطای حاصله در کار دست رسانی تأثیر قابل‌توجهی ندارد ازاین‌رو در کار هدفمند دست رسانی، خللی ایجاد نمی­شود. از طرفی برای آزمودن مقاوم بودن کنترل‌کننده توأم ترمینال لغزشی و شبکه عصبی، اغتشاش خارجی از نوع درصدی از گشتاورها را به هر سه مفصل اعمال کرده‌ایم. اغتشاشات هر سه مفصل از 0.3 ثانیه شروع و با تغییرات در دامنه­شان در نظر گرفته‌شده‌اند که با مقایسه مقدار آن­ها در هر زمان با گشتاورهای مفاصل در شکل (12) می‌توانیم دامنه اغتشاشات اعمال‌شده را در هرلحظه زمانی به‌صورت درصدی از گشتاورهای مفاصل به دست آوریم. سیگنال­های اغتشاشی از نوع گشتاورهای هر سه مفصل را همراه با سیگنال­های گشتاور حاصل از ماهیچه‌های کنترل‌شده برای ایجاد حرکت مفاصل نشان داده­ایم تا تطبیق خروجی نهایی مدل ماهیچه‌های بکار رفته، در حکم گشتاورهای مفاصل را در کنار اعمال اغتشاش نشان دهیم. از طرفی مسیرهای ردیابی شده هر سه مفصل را همراه با مسیرهای مطلوبشان و نیز خطاهای ردیابی هر سه مفصل برحسب درجه و نیز خطاهای بازیابی مسیر عملگر نهایی را در دو مختصات x,y در صفحه حرکت به ترتیب در شکل‌های (30-21) نشان داده­ایم که معیارهایی از مقاوم بودن کنترل‌کننده ترکیبی ترمینال لغزشی و شبکه عصبی پرسپترون در برابر اغتشاشات اعمالی به هر سه مفصل می‌باشند.

 

شکل (21): از بالا به پایین اغتشاش از نوع گشتاور اعمالی به مفصل شانه و تغییرات سیگنال گشتاور تطبیق یافته توسط کنترل‌کننده ترکیبی برای مفصل شانه نشان داده‌شده است.

 

شکل (22): از بالا به پایین اغتشاش از نوع گشتاور اعمالی به مفصل شانه و تغییرات سیگنال گشتاور تطبیق یافته توسط کنترل‌کننده ترکیبی برای مفصل آرنج نشان داده‌شده است.

 

شکل (23): از بالا به پایین اغتشاش از نوع گشتاور اعمالی به مفصل شانه و تغییرات سیگنال گشتاور تطبیق یافته توسط کنترل‌کننده ترکیبی برای مفصل مچ نشان داده‌شده است.

 

شکل (24): ردیابی مسیر مطلوب مفصل شانه را در اعمال اغتشاش نشان می­دهد که data1 مسیر مطلوب و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل توأم ترمینال لغزشی و شبکه پرسپترون است.

 

شکل (25): ردیابی مسیر مطلوب مفصل آرنج را در اعمال اغتشاش نشان می­دهد که data1 مسیر مطلوب و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل توأم ترمینال لغزشی و شبکه پرسپترون است.

 

شکل (26): ردیابی مسیر مطلوب مفصل مچ را در اعمال اغتشاش نشان می­دهد که data1 مسیر مطلوب و data2 مسیر ردیابی خروجی مدل کنترل‌شده توسط کنترل توأم ترمینال لغزشی و شبکه پرسپترون است.

 

شکل (27): خطای ردیابی مسیر مطلوب مفصل شانه را برحسب درجه نشان می­دهد. (به هنگام اعمال اغتشاش در کنترل ترکیبی ترمینال و شبکه عصبی)

 

شکل (28): خطای ردیابی مسیر مطلوب مفصل آرنج را برحسب درجه نشان می­دهد. (به هنگام اعمال اغتشاش در کنترل ترکیبی ترمینال و شبکه عصبی)

 

شکل (29): خطای ردیابی مسیر مطلوب مفصل مچ را برحسب درجه نشان می­دهد. (به هنگام اعمال اغتشاش در کنترل ترکیبی ترمینال و شبکه عصبی)

 

شکل (30): خطای بازیابی مسیر عملگرنهایی را در هر دو مختصات x,y در زمان به‌کارگیری روش لایه‌مرزی و اعمال اغتشاشات از نوع گشتاور به هر یک از مفاصل را نشان می­دهد.

 

5- نتیجه‌گیری

نتایج نشان داده­اند که کنترل ترکیبی ترمینال لغزشی و شبکه پرسپترون، پهنای پالس­های تحریک به هر سه مفصل را در حضور اغتشاشات به‌خوبی تطبیق داده­اند و کنترل‌کننده مقاومت مطلوبی را در برابر اغتشاشات اعمالی از خود نشان داده است که در این صورت مسیر از پیش تعیین‌شده عملگرهایی با خطای بسیار مطلوبی در کار هدفمند دست رسانی بازیابی شده است. ما در این تحقیق یک‌بار کنترل ترمینال لغزشی را به‌طور مجزا به مدل بازو اعمال کردیم و خطاهای ردیابی مسیرهای مطلوب در کل در هر سه مفصل کمتر از 0.06± درجه به دست آمدند اما برای کاهش چترینگ، ترکیب کنترل‌کننده‌های ترمینال لغزشی و شبکه پرسپترون را به مدل بازو اعمال کردیم که خطاهای ردیابی مسیرهای مطلوب در کل در هر سه مفصل در بازه (0.5 و 0.05-) درجه تغییرات داشتند که خطاهای بسیار مطلوبی را در بازیابی مسیر عملگر نهایی نشان داده­اند. بعد از اعمال اغتشاش از نوع گشتاور به کنترل ترکیبی، خطاهای ردیابی مسیرهای مطلوب در کل در هر سه مفصل در رنج 0.4± درجه حاصل‌شده‌اند.

در هر سه مرحله خطاها در حد بسیار مطلوبی کم است. ازاین‌رو مفاصل شانه، آرنج و مچ برای حرکت بازو در کار دست رسانی حتی با اعمال اغتشاشات با دامنه­های بسیار نزدیک و یا در بعضی لحظه­های زمانی بیشتر از گشتاورهای تولیدشده توسط ماهیچه­ها، به‌صورت بسیار مطلوبی کنترل‌شده‌اند و عملکرد مقاوم بودن کنترل‌کننده را اثبات نموده­اند. علاوه بر کنترل‌کننده ترکیبی و مقاوم که با کاهش چترینگ خطاهای بسیار کمی را در ردیابی مسیرهای مطلوب ایجاد کرده، الگوریتم مسیریابی LVI-PDNN، مسیرهای مطلوب را در فضای مفاصل به‌صورت برخط تولید کرده است. مسیر از پیش تعیین‌شده برای عملگر نهایی را از طریق مسیرهای مطلوب تولیدشده در فضای مفاصل به‌وسیله سینماتیک مستقیم بازیابی نمودیم که در هر دو مختصات خطا بسیار جزئی و کمتر از 4-10 متر حاصل‌شده‌اند و این امکان را فراهم کرده که در هنگام مواجه با افزونگی سینماتیکی، با توجه به نیاز به تعیین مسیر واحدی از بین مسیرهای ممکن در ایجاد حرکت مطلوب در فضای مفاصل، می­توان به‌صورت برخط مسیرهای مطلوب را جهت ردیابی به کنترل‌کننده اعمال کرد. در ایجاد حرکت دست رسانی موردنظر تنها کافی است که نقاط شروع و پایان حرکت و مسیر عملگر نهایی بین این دونقطه برای الگوریتم مسیریابی برخط LVI-PDNN داده شوند و این الگوریتم با بهینه­سازی تابع هزینه تعریف‌شده از نوع QP که در اینجا حداقل انرژی جنبشی است، مسیرهای مطلوب مفاصل را به‌صورت برخط تولید می­کند. این تحقیق در آینده برای کنترل حرکت در فضای سه‌بعدی بر روی یک مدل بازوی انسان با چهار درجه آزادی اعمال خواهد شد و از طرفی مدل خستگی و تأثیر آن به‌واسطه تحریکات مداوم بر روی ماهیچه­ها ناشی از تحریک الکتریکی عملکردی را نیز در تعیین مقاوم بودن کنترل‌کننده بررسی خواهد نمود. اما با تمام توانمندی‌های مطرح‌شده، با توجه به کاهش مطلوب به‌دست‌آمده در چترینگ، همچنان زمینه­های تحقیقی برای حذف کامل آن باقی است. چراکه مسئله چترینگ می‌تواند در عمل منجر به ناپایداری سیستم تحت کنترل شود. از طرفی وجود موانع دینامیکی و استاتیکی در محیط کار درحرکت دست رسانی در نظر گرفته نشده که می‌بایست الگوریتم مسیریابی برخط را برای تولید مسیرهای جدید در مقابل با موانع با همان هدف اولیه توسعه داد و عملکرد را هر چه بیشتر با واقعیت نزدیک نمود.



[1]Saturating approximation

[2]Jezernik

[3]Adaptive Nonlinear Control

[4] Quadratic Programming (QP)

[5]solver

[6] Linear Variational Inequality (LVI)

[7] Linear Variational Inequality-Primal Dual Neural Network

[8]Nonlinear recruitment curve

[9]Coriolis and Centrifugal

10 Back Propagation

1-  

[1]  Kobravi H.R. and Erfanian A. "Decentralized adaptive robust control based on sliding mode and nonlinear compensator for the control of ankle movement using functional electrical stimulation of agonist–antagonist muscles," Journal of neural engineering, Vol. 6, p. 046007, 2009.
[2]  Slotine J.J. E. and Li W. Applied nonlinear control vol. 199: Prentice hall New Jersey, 1991.
[3]  T. Schauer, et al., "Sliding-mode control of knee-joint angle: experimental results," in 7th Annu. Conf. Int. Functional Electr. Stimul. Soc., Ljubljana, Slovenia, 2002.
[4]  Jezernik S., et al., "Sliding mode closed-loop control of FES controlling the shank movement," Biomedical Engineering, IEEE Transactions on, Vol. 51, pp. 263-272, 2004.
[5]  Ajoudani A. and Erfanian A., "A neuro-sliding-mode control with adaptive modeling of uncertainty for control of movement in paralyzed limbs using functional electrical stimulation," Biomedical Engineering, IEEE Transactions on, Vol. 56, pp. 1771-1780, 2009.
[6]  Nekoukar V.  andErfanian A., "Adaptive fuzzy terminal sliding mode control for a class of MIMO uncertain nonlinear systems," Fuzzy Sets and Systems, Vol. 179, pp. 34-49, 2011.
[7]  Zhang Y., et al., "A unified quadratic-programming-based dynamical system approach to joint torque optimization of physically constrained redundant manipulators," Systems, Man, and Cybernetics, Part B: Cybernetics, IEEE Transactions on, Vol. 34, pp. 2126-2132, 2004.
[8]  Zhang Y., "Inverse-free computation for infinity-norm torque minimization of robot manipulators," Mechatronics, Vol. 16, pp. 177-184, 2006.
[9]  Zhang Y. "Towards piecewise-linear primal neural networks for optimization and redundant robotics," in Networking, Sensing and Control, 2006. ICNSC'06. Proceedings of the 2006 IEEE International Conference on,pp. 374-379,2006.
[10]   Zhang Y. et al. "MATLAB Simulink modeling and simulation of LVI-based primal–dual neural network for solving linear and quadratic programs," Neurocomputing, Vol. 72, pp. 1679-1687, 2009.
[11]   Guigon E. et al, "Computational motor control: redundancy and invariance," Journal of neurophysiology, Vol. 97, pp. 331-347, 2007.
[12]   Abbas J. J. and Chizeck H. J. "Neural network control of functional neuromuscular stimulation systems: computer simulation studies," Biomedical Engineering, IEEE Transactions on, Vol. 42, pp. 1117-1127, 1995.
[13]   Yu H. and Han R. P. "Real time dynamics and control of a digital human arm for reaching motion simulation," in Advances in Artificial Reality and Tele-Existence, ed: Springer, pp. 425-436,2006.
[14]   Luttgens K. and Wells K. "Kinesiology: Scientific basis of human movement," Dubuque: Brown & Benchmark, pp. 147-173, 1982.