Document Type : Research Article
Authors
Department of electrical engineering, Faculty of Engineering,University of Isfahan, Isfahan, Iran
Abstract
Keywords
با افزایش کاربرد سیستمهای مدرن بی سیم مخابراتی لزوم هوشمند سازی در آنها افزایش مییابد. از سوی دیگر، اندازهگیری ها و آزمایشهای انجام شده در سالهای اخیر توسط FCC بهینه نبودن بهرهوری طیف فرکانسی را نمایان میکند [2]. رادیوهای شناختگر[1](CR) سیستمهای هوشمندی هستند که برای بهره برداری صحیح از طیف فرکانسی ابداع شدهاند. میتولا[2] نخستین کسی بود که ایدة رادیوهای شناختگر را بدین صورت عنوان کرد [2] :
"رادیو شناختگر نمادی است برای یک سیستم استدلال گر که به منظور رسیدن به حد مطلوبی از یک یا چند پارامتر مخابراتی طراحی شده است."
یکی از تواناییهای مهم رادیوهای شناختگر مشاهدة لحظه به لحظة طیف فرکانسی و امکان یافتن باند مناسب برای ایجاد ارتباط مورد نظر است. بدین وسیله یک رادیوی شناختگر قادر خواهد بود از باند فرکانسی که مجوز استفاده از آن را کاربر دیگری داراست، استفاده نماید (در صورتی که برای دارندة مجوز مزاحمتی در ارتباط رادیویی ایجاد نکند). البته، فقط مناسب بودن نسبت سیگنال به نویز و تداخل برای برقراری ارتباط مناسب بین کاربران کافی نیست، بلکه با توجه به مفهوم دمای تداخلی، چگالی توان در باند مورد نظر نیز نباید از حد مجاز بیشتر شود. شبکه رادیویی تشکیل شده از رادیوهای شناختگر، با نام شبکه رادیویی هوشمند نیز شناخته میشود. علاوه بر خصوصیات مناسب رادیوهای شناختگر که به قسمتی از آن اشاره شد، امتیازاتی هم برای شبکههای رادیویی هوشمند قابل شمارش است. از جمله می توان به امکان برقراری ارتباط بین تعداد زیادی گره به صورت کاربر محور، درآمدزایی برای کاربران دارای مجوز به وسیلة اجاره دادن طیف فرکانسی که در اختیار دارند و امکان تخصیص مناسب منابع شبکه به کاربران شبکههای بدون سیم اشاره نمود [3].
در این مقاله مدیریت و بهینه سازی یک شبکه رادیویی شناختگر نوعی با استفاده از نظریه بازی بررسی قرار میشود. در این شبکة کاربران لزومی به پیروی از یک مرکز کنترل یا برقراری ارتباط از طریق آن را نداشته، از یک الگوریتم توزیع شده[3] که برای اداره شبکه طراحی شده است پیروی میکنند. کاربران شبکه مختارند با توجه به چارچوبهای شبکه و با توجه به ترجیحات شخصی دربارة نوع ارتباط خود به شیوة دلخواه تصمیم گیری کنند. بنابراین کاربران شبکه به صورت پیش فرض خودخواه در نظر گرفته شدهاند. در شبکه مورد بررسی با تمامی کاربران بدون مجوز همانند یک کاربر دارای مجوز برخورد میشود و شبکه خالی از رادیوهای دارای مجوز است. چنین شبکهای را یک شبکه اختصاص یافته به کاربران بدون مجوز مینامند[4]. چنین شبکه هایی در مطالعات مختلف بررسی شدهاند. در [4] مشکلاتی که در پیادهسازی این گونه شبکهها وجود دارد، ذکر شده و تعدادی از مشخصات به عنوان مشخصات کلیدی لازم برای پروتکل ادارة شبکه بیان شده است. در [5] و [6]، توابع سودی معرفی شده است که در صورت رعایت شدن آنها توسط کاربران شبکه، همکاری بین کاربران القا میگردد.
پروتکل MAC [5] ارائه شده در [5]، که شباهت زیادی به تبادل بستههای اطلاعاتی RTS/CTS بر اساس استاندارد IEEE802.11 دارد، توانایی اجرای الگوریتم مورد نظر را داراست. به طور خلاصه، در این روش فرستنده بستهای به نام RTS[6] به گره مقصد ارسال می کند و گره مقصد با ارسال بسته CTS [7] برای دریافت اطلاعات اعلام آمادگی مینماید. دیگر گره های موجود در شبکه، پس از دریافت این دو بسته، مدتی در ارسال اطلاعات خود توقف مینمایند. یکی از نقاط ضعف طرحهای ارائه شده در [5] و [6] اجبار کردن نوع تابع سود به کاربران شبکه است. چنین چیزی خارج از توان ناظر شبکه بوده یا حداقل به شبکهای با کاربران همکاری کننده نیاز دارد و در شبکه با کاربران خودخواه قابل اجرا نیست. برای تحلیل این شرایط به سازوکارهایی برای بررسی انطباق عملکرد کاربران با تابع سود معرفی شده به آنها نیاز است که موجب پیچیدگی اجرا و پیاده سازی طرح مورد نظر خواهد شد.
در شبکههایی که توزیع منابع شبکه به صورت غیر مرکزی و توزیع یافته صورت میگیرد، از قیمت گذاری به عنوان اهرمی برای افزایش همکاری میان کاربران شبکه استفاده میشود. در [7] و [10] از یک شیوة قیمت گذاری خطی استفاده شده است. مزیت چنین قیمت گذاری را میتوان سادگی مفهوم و پیاده سازی آسان آن عنوان کرد. در [10] با استفاده از انتخاب ضریب قیمتگذاری مناسب، بهبود وضعیت شبکه با توجه به معیار بهینگی پرتو[8] مورد نظر قرارگرفته است.همچنین، یک قیمتگذاری بهینه نیز ارائه شده که پیچیدگی پیادهسازی زیادی دارد. یک شیوة قیمتگذاری پیشرفتهتر، قیمتگذاری تطبیق یافته است که در آن ضریب قیمتگذاری برای هر کاربر شبکه، (بر اساس شرایط نهایی مطلوب) عددی خاص و متفاوت با دیگر کاربران باشد [8]. این شیوه به نزدیک شدن تعادل به بهینگی پرتو کمک می کند. در [8] یک الگوریتم واترفیلینگ بر مبنای قیمتگذاری ارائه شده است. این شیوه به صورت توزیع شده قابل اجرا بوده، میتوان از آن برای مدیریت شبکههای غیرهمکارانه استفاده کرد. نوع دیگر از قیمتگذاری تطبیق یافته در [9] ارائه شده است. به علاوه، الگوریتم واترفیلینگ [8] و [9] ارتقا یافته است.
در این مقاله نشان میدهیم که اگر تابع سود یک شبکه با بازی پتانسیلی همکارانه، با اصلاح اندکی به عنوان تابع قیمتگذاری در یک شبکه غیر همکارانه به کار گرفته شود، به پتانسیلی شدن بازی حاکم بر شبکه منجر خواهد شد. به طور مشخص، از تابع سود پیشنهاد شده در [5] به عنوان تابع قیمتگذاری شبکه غیرهمکارانه استفاده میکنیم. فرض میکنیم هر کاربر با توجه به منفعت خویش تابع سود شخصی خود را، که مطابق با ترجیحات اوست، انتخاب کند. تابع سود نهایی هر کاربر از حاصل جمع تابع سود شخصی او و تابع قیمتگذاری به دست خواهد آمد. بدین ترتیب، استفاده از این روش بر خلاف الگوریتم ارائه شده در [5]، در یک شبکه غیرهمکارانه امکان پذیر است. به کارگیری تابع قیمتگذاری معرفی شده موجب پتانسیلی شدن بازی حاکم بر شبکه می شود. در یک بازی پتانسیلی، همگرایی بازی به تعادل نش در تعداد محدودی گام از شروع بازی تضمین شده است [13]. شبیه سازیهای عددی و رایانهای انجام شده، بهینگی پرتو و میزان مناسبی از مجموع تداخل کاربران بر یکدیگر و نرخ مجموع[9] را برای تمام تعادل های این بازی نشان میدهد که گواهی برای اثبات کارایی و مناسب بودن الگوریتم ارائه شده است. این مقاله به شکل زیر سازماندهی شده است. در بخش 2 مفهوم کلی نظریه بازی و قابلیتهای آن در طراحی شبکه های رادیویی هوشمند بیان شده است. در بخش 3 ساختار شبکه مورد بررسی و به دنبال آن در بخش 4 مدلسازی آن با استفاده از نظریه بازی را بیان کردهایم. بخش 5 به ارائه نتایج شبیه سازی و توضیح مزیتهای حاصل شده بر اثر قیمتگذاری پیشنهادی اختصاص دارد و نهایتا جمع بندی مقاله در بخش 6 انجام شده است.
نظریه بازی یک ابزار ریاضی است که میتواند به خوبی برخوردهای میان تعدادی فرد یا گروه تصمیم گیرنده را مدل سازی کند. این نظریه کاربرد فراوانی در اقتصاد خرد داشته، و به تازگی مورد توجه علوم مهندسی نیز قرار گرفته است. نظریه بازی در مدیریت، طراحی و تحلیل شبکههای رادیویی شناختگر نیز کاربرد فراوان دارد. با این ابزار، امکان طراحی الگوریتمهای توزیع شده یا متمرکز[10] اختصاص منابع، بررسی شبکههای همکارانه یا غیرهمکارانه یا مهندسی کردن پروتکل MAC شبکه میسر میشود [11]. عللی را که نظریه بازی اهمیت چشمگیری در بررسی شبکههای شناختگر پیدا کرده، میتوان بدین صورت برشمرد [12]:
- انطباق محیط یک شبکة شناختگر با عناصر موجود در نظریه بازی؛
- توانایی نظریه بازی در حل مسألههایی چند منظوره (ابزار و قضایای زیادی در نظریه بازی برای بررسی و حتی اندازه گیری بهینگی تعادلهای بازی، که در آن سود تعداد زیادی فرد یا گروه بایستی در نظر گرفته شود، وجود دارد)؛
- وجود مفهوم بازیهای غیرهمکارانه در نظریه بازی که این امکان را فراهم می کند تا بتوان با استفاده از آن به بررسی شبکههای توزیع یافته و غیر مشارکتی پرداخت.
در یک شبکه رادیویی شناختگر، کاربران معمولا برای رسیدن به اهداف مورد نظر خود، خودخواهانه و بر اساس ترجیحات شخصی عمل میکنند. نظریه بازی به ما اجازه میدهد تا تابع سودی به هر کاربر نسبت دهیم و بدین وسیله مدلی برای شیوة اتخاذ استراتژی هر کاربر داشته باشیم. بررسی نقاط تعادل شبکه (در صورت وجود) از ملاحظات ناظر و طراح شبکه است. نقاط تعادلی که بهینه بوده و در آن، شبکه دارای مشخصات مخابراتی مناسبی باشد، بهترین نشانة یک الگوریتم کارآمد توزیع منابع هستند.
شبکة مورد نظر ما یک شبکة رادیویی شناختگر شامل K جفت کاربر با توانایی ارسال و دریافت اطلاعات است که در کانال به ارسال اطلاعات میپردازند. کاربران به صورت تصادفی در یک فضای پراکنده شدهاند. فاصلة میان فرستنده و گیرندة یک کاربر (یک جفت) کمتر از فرض شده است. ضمناً توپولوژی شبکه در هر اجرا ثابت در نظر گرفته شده؛ بدین معنا که سرعت احتمالی جابهجایی کاربران شبکه در زمان همگرایی شبکه تغییر محسوسی در توپولوژی آن پدید نمیآورد. تعدادی از مشخصههای لازم یک شبکه بدون سیم اختصاص یافته به رادیوهای شناختگر را می توان بدین صورت برشمرد [4]:
-توانایی ارسال اطلاعات حتی در گیرندهها؛
-محدودیت داشتن کاربران در انتخاب توان ارسالی برای کنترل تداخل کلی شبکه؛
-امکان ارسال بستههای سیگنالینگ[11] میان کاربران برای ایجاد محیطی که در آن کاربران توانایی برقراری ارتباط به صورت اقتضایی[12] را با یکدیگر داشته باشند.
در شبکة مورد بررسی، توان ارسالی کاربران بین دو مقدار مینیمم و ماکزیمم محدود میشود. همچنین، شبکه دارای تعدادی کانال برای ارسال داده و یک کانال کنترلی مشترک است. از طریق کانال کنترلی کاربران میتوانند بستههای سیگنالینگ خود را ارسال و دیگر کاربران را از موقعیت و شرایط خود باخبر کنند. این کار در شبکههای بدون مدیریت مرکزی، برای استفاده بهینه از منابع شبکه و برقراری اتصال مناسب بین کاربران لازم است. کسب اطلاعات کلیه کاربران، همچنین، میتواند موجب امکان پذیر شدن مدیریت شبکه از جانب ناظر گردد؛ از جمله برای ارائۀ شیوه قیمتگذاری بهینه، اغلب به اطلاعات جامعی از تمامی کاربران شبکه نیاز است. البته، جمع آوری کلیه اطلاعات کاربران یک شبکه که با یک الگوریتم توزیع شده اداره می گردد، دشوار بوده، به پیچیدگی و در نتیجه افزایش هزینه مدیریت شبکه میافزاید. این توضیح ضروری است که توزیع شده بودن الگوریتم صرفا به معنای این است که یک مرکز کنترل و تصمیم گیری متمرکز وجود ندارد و به هیچ وجه به معنای بی قاعده بودن شبکه نیست، بلکه باید مکانیسمی برای مدیریت شبکه وجود داشته باشد که در غالب پروتکل MAC شبکه پیاده سازی میگردد. الگوریتمهای ارائه شده در [5] و [6] و قیمتگذاری های ارائه شده در [8] و [10] با داشتن اطلاعات محدود محلی از کاربران، که از طریق سیگنالینگ در کانال کنترلی قابل دسترسی است، شبکه را به سمت تعادل های بهینه یا نزدیک به بهینه میبرد. الگوریتم ارائه شده در این مقاله نیز قابلیت پیادهسازی به صورت توزیع شده را داراست و تنها به اطلاعات محلی کاربران نیاز دارد که از طریق کانال کنترلی قابل دریافت هستند.
فعل و انفعالات میان کاربران شبکه برای انتخاب کانال و توان ازسالی را به صورت دوبازی غیر همکارانه به شکل و تعریف میکنیم که در آنها مجموعة محدودی متشکل از K بازیکن با رفتار منطقی[13] است (یک بازیکن منطقی بازیکنی است که استراتژی خود را براساس افزایش تابع سود خود تغییر میدهد، نه کاهش آن و یا کاهش تابع سود دیگر بازیکنان). فضای استراتژی کل بازیکنان بوده، استراتژی به صورت زیر بیان می شود.
(1) |
بیانگر توانی است که کاربر j ام در کانال i ام ارسال میکند. تعداد کانالها M است. اگر صفر باشد؛ یعنی توسط کاربر j ام در کانال i ام توانی ارسال نمیشود. همچنین، فرض می شود . ستون iام ماتریس S را مینامیم که نشان دهنده بازی بازیکنi ام است. هر بازیکن فقط در یک کانال توان ارسال می کند. به عبارت دیگر، در هر فقط یک مؤلفه غیر صفر وجود دارد که آن را می نامیم. نیز تابع سود[14] بازیکن i ام است.
بازی ای را در نظر بگیرید که در آن تابع سود کاربران به شکل بوده و با رابطه زیر تعریف می شود:
(2) |
در این رابطه داریم :
نشان دهندة بهره کانال میان فرستندة i ام و گیرندة j ام است. فرض می شود که کانال تغییرات زمانی ندارد و مقادیر با داشتن توپولوژی شبکه به صورت یکتا بهدست میآید.
در رابطه (2) منظور از مجموعه استراتژی تمام کاربران بجز کاربر i ام است. مجموع تداخل ایجاد شده توسط کاربر i ام روی بقیه کاربران بعلاوه تداخل ایجاد شده بقیه کاربران روی کاربر i ام را نشان میدهد. ، یک تابع سود مناسب و معرفی شده از جانب طراح شبکه است که کاربران آن شبکه موظف به انتخاب استراتژی خود بر این اساس هستند. کاربرانی که برخورد همکارانه داشته باشند، این تابع را به عنوان تابع سود خود پذیرفته، بر همین اساس بازی میکنند. شبکه ای که همه کاربران آن از تابع سود استفاده کنند، در [5] بررسی شده است. نشان داده شده است که در این حالت بازی حاکم بر شبکه پتانسیلی شده، همگرایی سریع به تعادل نش اتفاق میافتد؛ ضمنا در تعادل های بررسی شده میزان SIR کاربران شبکه بهبود یافته است. به عبارت دیگر یک تابع سود مناسب است که در صورت همکاری کاربران، به نتایج بسیار مناسبی منجر میشود.
در یک محیط غیرهمکارانه تعدادی از کاربران به علت ترجیحات شخصی، استراتژی خود را بر اساس توابع سود متفاوت انتخاب میکنند. این بازیکنان را اصطلاحاً بازیکنان خودخواه مینامیم. تابع ، را که در رابطه (3) تعریف شده است، میتوان به عنوان مثالی از تابع سود کاربران خودخواه شبکه در نظر گرفت.
(3) |
صورت کسر در این تابع، خودخواهانه بودن انتخاب استراتژی این کاربران را نشان میدهد. در حقیقت، کاربری که را به عنوان تابع سود خود انتخاب میکند انتخاب بیشترین توان ارسالی را مناسب میبیند؛ اگر چه این امر موجب ایجاد تداخل بیشتر روی دیگر کاربران باشد. فرض کنیم در بازی کاربرانی که رویکرد همکارانه دارند، از و کاربران خودخواه از توابع سود شخصی خود استفاده کنند. شبکه مربوط به بازی را Net-1 مینامیم. روشن است که در Net-1 مزایای ذکر شده قبلی وجود نخواهد داشت. یک راه کنترل کیفیت در چنین شبکه هایی قیمتگذاری است [8]. با اضافه کردن قیمتگذاری مشخصی به Net-1 مدل دیگری را در نظر میگیریم و آن را Net-2 مینامیم. بازی حاکم بر این شبکه را نشان میدهد که در آن کاربران برای انتخاب توابع سود آزادند. در این حالت از جانب ناظر شبکه اجباری در انتخاب تابع سود اعمال نمیشود، بلکه از تابع (که در Net-1 به عنوان تابع سود مطلوب فرض شده بود) با ضریب مناسب به عنوان تابع قیمتگذاری استفاده میشود.
اساسیترین مفهومی از نظریه بازی که از آن برای تحلیل بازی های غیرهمکارانه استفاده میشود، تعادل نش[15] است. پس از رسیدن به تعادل نش، هیچ کاربری استراتژی خود را تغییر نمیدهد. به همین علت، برای مقایسه دو شبکه به مقایسه تعادلهای نش آنها خواهیم پرداخت. برای این منظور، نخستین گام اطمینان حاصل کردن از همگرایی دو بازی مورد نظر به تعادل نش است. بدیهی است بازیای که به تعادل نش همگرا نشود و دائماً در حال تغییر باشد، اطلاعات معناداری برای مقایسه به دست نمیدهد. بازی پتانسیلی دستهای از بازیهاست که در اکثر انواع آن همگرایی بازی تضمین شده است [13].
یکی از مهمترین چالشها در شبکه رادیوهای شناختگر، ایجاد خصوصیت انطباق پذیری در شبکه های شناختگر است. همگرایی شبکه شناختگر به یک نقطه تعادل میتواند فراهم آورنده این خصوصیت باشد. شبکهای که به سرعت قابلیت رسیدن به یک تعادل را داراست، می تواند خود را به خوبی با تغییراتی که رخ میدهد، وفق دهد [14]. بعلاوه، وجود تعادل نش به طراح بازی اجازه پیش بینی حالات بازی و اعمال شیوه های بهینهسازی برای ارتقای سطح نقاط تعادل را خواهد داد.
بازیهای پتانسیلی از جمله بازیهایی هستند که وجود تعادل نش برای آنها ثابت میشود. اگر در یک بازی پتانسیلی کامل یا معمولی با بازیکنان منطقی، در هر مرحله از بازی تنها یک بازیکن اجازة تغییر استراتژی خود را داشته باشد، همگرایی به تعادل نش قطعی است [13]. از مفهوم بازی پتانسیلی در حیطة شبکههای شناختگر استفاده فراوانی شده است [6]. دو نوع مهم بازیهای پتانسیلی عبارتند از: بازی پتانسیلی کامل[16] و بازی پتانسیلی معمولی[17]. بازی یک بازی پتانسیلی کامل نامیده میشود؛ اگر تابع وجود داشته باشد، به طوریکه شرط زیر را برآورده کند:
(4) |
همچنین یک بازی پتانسیلی معمولی خوانده میشود؛ اگر
(5) |
اصطلاحا تابع تابع پتانسیل بازی خوانده شود. در یک بازی پتانسیلی، هر بازیکن قابلیت تغییر مقدار تابع پتانسیل شبکه را دارد. به علاوه باید دقت کرد که تابع پتانسیل شبکه الزاماً تابع سود جمعی بازیکنان یک بازی را نمایش نمیدهد، بلکه اندازة پیشرفت بازی به سمت تعادل نش را آشکار میسازد [13].
نشان داده شده است که بازیهای تخصیص توان در شبکه از طریق تابع سود حداقل یک بازی پتانسیل معمولی خواهند بود [14] و [15]. همچنین، در [5] نشان داده شده است که بازی کاهش تداخل جمعی بر مبنای تابع سود یک بازی پتانسیلی کامل است. در این بازی تابع پتانسیل به شکل زیر بهدست آمده است.
(6) |
این نکته قابل توجه است که بازی ای که در آن کاربران ترکیبی از دو تابع سود و را استفاده میکنند (همانند ) الزاماً حتی پتانسیلی معمولی هم نیست [14].
وجود کاربران خودخواه در یک شبکه غیرهمکارانه بازدهی شبکه را کاهش خواهد داد؛ مگر اینکه کاربران به نحوی محدود و یا مجبور به همکاری شوند. از قیمتگذاری میتوان به عنوان یک اهرم برای ترغیب بازیکنان به همکاری و تضمین رسیدن به تعادل و ارتقای بهینگی نقطة تعادل شبکه استفاده کرد [8] و [10]. شبکههای Net-1 و Net-2 شبکه های غیرهمکارانه هستند. در Net-2 از تابع به عنوان تابع قیمتگذاری استفاده میشود ( یک ضریب ثابت بزرگتر از صفر است). بدین ترتیب، تابع به عنوان تابع سود بازیکن i ام در به شکل زیرخواهد بود.
(7) |
که تابع شخصی سود هر کاربر است؛ در حالتی که کاربر بهصورت همکارانه بازی کند و در غیر این صورت برابر تابع سود شخصی آن کاربر است. قیمتگذاری بدین شکل موجب میشود هر کاربر ایجاد تداخل کمتر با دیگر کاربران را به طور غیر مستقیم در ملاحظات خود قرار دهد و در نتیجه، نوعی همکاری بین کاربران القا میگردد. میتوان نشان داد بازی حاکم بر Net-2 یک بازی پتانسیلی معمولی بوده و بنابراین همگرا میشود (ضمیمه 1). بعلاوه شبیه سازیها نشان میدهد نقاط تعادل شبکه نیز به نقاط بهینه نزدیک است.
الگوریتم دسترسی کاربران به منابع شبکه باید استفاده کارآمد از منابع شبکه و رسیدن به همگرایی را تضمین کند. بدین منظور، مشابه با [5]، یک کانال کنترلی مشترک میان تمام کاربران در نظر گرفته شده که به آنها اجازة دسترسی به اطلاعاتی از قبیل توان ارسالی و شماره کانال یا کانالهایی را که دیگر کاربران در آن به ارسال اطلاعات مشغولند، میدهد. وجود اطلاعات کانال کنترلی به یک رادیوی شناختگر اجازه میدهد تا بتواند تابع را در هر حالت از شبکه محاسبه کند.
دسترسی کاربران به منابع شبکه نیز بهصورت چند مرحله ای فرض میشود؛ بدین معنا که پس از اجرای هر گام از بازی، در صورتی که کاربران شبکه هنوز سودی در تغییر استراتژی خود داشته باشند، بازی ادامه خواهد یافت تا زمانی که به بازی به تعادل برسد. کاربران در مدل پیشنهادی ملزم به انتخاب استراتژی نهایی خود در یک مرحله نیستند و تا زمانی که امکان سود بیشتر وجود دارد، اجازة تغییر استراتژی دارند. نشان داده شده است که تعادل نش در بازیهای تک مرحلهای در مقایسه با بازی چند مرحله ای با توجه به معیارهای مختلف، از بهینگی کمتری برخوردار است [17].
در یک بازی پتانسیلی معمولی، در صورتی که بازیکنان منطقی بوده و در هر مرحله از بازی تنها یک بازیکن اجازة تغییر استراتژی خود را داشته باشد، یک مسیر متناهی پیشرفت[18] وجود دارد [18]. در حقیقت، طبق روابط (4) و (5) تغییر استراتژی بیش از یک بازیکن در یک گام بازی ممکن است موجب افت تابع پتانسیل و در نتیجه دور شدن از همگرایی گردد. بنابراین، لازم است در هر گام بازی تنها یک کاربر اجازة تغییر استراتژی خود را داشته باشد. دو نوع الگوریتم دسترسی قطعی و تصادفی به کانال کنترلی در [5] و [6] استفاده شده است. در روش راند- رابین[19] با ایجاد یک صف دایروی، در هر مرحله تنها یک کاربر اجازه تغییر استراتژی خود را پیدا می کند. این روش قطعی بوده و فقط در حالتی که مدیریت متمرکز در شبکه موجود باشد، قابل پیاده سازی است. در روش دیگر هر کاربر شبکه با انجام یک آزمایش برنولی با احتمال اجازۀ تغییر استراتژی خود را خواهد یافت (K تعداد کاربران شبکه است). این شیوه که غیر همزمان[20] نامیده شده است، برای مدیریت توزیع شده مناسبتر است [6]. به کار گیری این شیوه اگر چه به نسبت روش راند-رابین همگرایی شبکه را کند می کند، ولی احتمال تغییر استراتژی چند کاربر به طور همزمان را به طور قابل توجهی کاهش می دهد.
پروتکل مورد استفاده MAC همان پروتکل ارائه شده در [5] است. برای مدیریت شبکه، جدول حالتی شامل اطلاعات توان و کانال انتخابی هر زوج فرستنده- گیرنده و بهرههای کانال تشکیل می شود که همه کاربران از طریق کانال کنترلی به این جدول دسترسی دارند. هر فرستنده، با انجام آزمایش برنولی و در صورت موفق بودن آزمایش با استفاده از این جدول، به محاسبه تابع سود خود به ازای تمامی استراتژیهای ممکن پرداخته، بهترین استراتژی را انتخاب می کند. پس از انتخاب استراتژی، جدول مربوط توسط کاربر برنده بهروز می شود. برنده شدن در آزمایش برنولی و تغییر در جدول حالت از طریق سیگنالینگ مناسب به اطلاع سایر کاربران خواهد رسید.
در بازیهایی که تعداد بازیکنان آنها زیاد بوده، دامنة انتخاب آنها در استراتژی وسیع است، تعداد نقاط تعادل زیاد خواهد بود. در چنین وضعیتی، این سؤال پیش خواهد آمد که کدام یک از این تعادلها نسبت به بقیه برتری دارد و یا از رخ دادن کدام یک از تعادلها باید به نحوی اجتناب نمود. معیارهای مختلفی برای بررسی بهینگی نقطة تعادل موجود است. در شبکه های رادیویی شناختگر معیارهایی چون ظرفیت شبکه [6] ، نسبت سیگنال به تداخل کاربران شبکه [5]، نرخ مجموع شبکه در نقطه تعادل [9-8] و سرعت همگرایی شبکه [5] و [6] و [8] برای بررسی کارآمد بودن شبکه مورد توجه قرار گرفته اند. برخی دیگر از این معیارها را نظریه بازی در اختیار ما قرار می دهد؛ از جمله میتوان به مجموع توابع سود بازیکنان یک بازی [10]، مجموع وزن دار توابع سود بازیکنان [8] و بهینگی پرتو [5] و [8] و [10] اشاره کرد.
تعریف بهینگی پرتو
را تابع سود بازیکن i ام ( ) ومجموعة را به عنوان مجموعة نقاط تعادل نش یک بازی در نظر بگیرید. تعادل یک تعادل بهینه پرتو نامیده میشود؛ اگر نتوان تعادل دیگری مثل s را یافت به طوری که به عبارت دیگر تعادل بهینه پرتو آن تعادلی است که در بازی، تعادلی دیگر وجود نداشته باشد که در آن همة بازیکنان بازی سود بیشتری کسب کنند. مرز بهینگی پرتو در تعادلهای یک بازی عبارت است از مجموعة تمام که تعادل بهینه پرتو هستند.
در بازیهایی که تعدادی تعادل بهینة پرتو وجود دارد و تعدادی دیگر از تعادلهای نش بازی بهینة پرتو نیستند، طراح بازی تلاش خواهد کرد با استفاده از ابزارهایی؛ از جمله قیمتگذاری، بازیهای تکراری و ... هر چه بیشتر بازی را به سمت تعادلهای بهینه پرتو سوق دهد. قرار داشتن تعادلهای یک بازی در مرز بهینگی پرتو، نشان دهندة کارآمد بودن قواعد حاکم بر بازی است.
در این قسمت رفتار دو شبکه Net-2 و Net-1 با استفاده از شبیه سازی رایانهای بررسی میشود. به علت وجود کاربران خودخواه، Net-1 در بعضی حالات اصلا همگرا نمیشود. برای امکان پذیر شدن مقایسه، حالاتی از Net-1 در نظر گرفته شدهاند که در آنها همگرایی رخ داده است. تعداد کاربران با رفتار غیرهمکارانه در هر دو بازی و یکسان و برابر 50 درصد کل کاربران در نظر گرفته شده است. در تابع را به عنوان تابع سود کاربران خودخواه در نظر گرفتهایم تا نمایانگر رفتار غیرهمکارانه آنها در بازی باشد. ساختار شبکه در بخش 3 توضیح داده شد. در شبیه سازی ، و فرض شده است. مقدار نیز برابر 50m در نظر گرفته شده است. و به ترتیب مقادیر1 و 2 هستند. برای تعیین نوبت تغییر استراتژی، کاربران از آزمایش برنولی مشابه آنچه در بخش 4-3 گفته شد استفاده میکنند.
شکل (1) نتیجه شبیه سازی Net-2 و Net-1 را در شرایط کاملاً یکسان نمایش میدهد. هر منحنی در این شکل قرینة مجموع تداخل کل کاربران شبکه یا همان مقدار ذکر شده در رابطة (6) را در طی گامهای بازیهای و نشان میدهد. در ضمیمه 1 نشان داده شده که این تابع، با لحاظ ضریب مناسب، تابع پتانسیل بازی نیز هست.
شکل (1): روند تغییر تابع پتانسیل در Net-1 و Net-2
همان طور که از رابطة (6) مشخص است، اندازة تابع پتانسیل بازی در هر گام متناسب با قرینة مجموع تداخل کل کاربران شبکه است. در یک بازی پتانسیلی، اندازه تابع پتانسیل بهطور مداوم افزایش مییابد. بر همین اساس، شکل (1) نه تنها پتانسیلی نبودن را نشان میدهد، بلکه نمایانگر بهبود مجموع تداخل کاربران در Net-2 نیز هست.
شکل(2) رفتار دو شبکة Net-2 و Net-1 را در 200 مرتبه شبیه سازی که در آنها ترتیب برندگان آزمایشهای برنولی، به طور تصادفی تغییر میکنند، نشان میدهد. همانگونه که مشاهده میشود، نوسانهای Net-1 در مقایسه با Net-2 قبل از همگرایی و در حالت گذرا بسیار زیاد بوده و بعلاوه دیده میشود که اندازة تابع پتانسیل Net-2 در اکثر نقاط بیشتر از Net-1 است و همگرایی نیز در Net-2 سریعتر رخ میدهد. برای مقایسه تاثیر تابع قیمتگذاری، روش قیمتگذاری معرفی شده در [10] نیز استفاده شده و نتایج بهطور همزمان در شکل(2) نشان داده شده است. از مقایسه نتایج مربوط میتوان به این نکته اشاره نمود که هر چند بهطور کلی قیمتگذاری ابزاری برای کنترل رفتار کاربران است، ولی این بدان معنی نیست که هرگونه قیمتگذاری عملکرد مناسبی داشته باشد.
نتایج بهدست آمده نمایانگر کارآمد بودن روش قیمتگذاری پیشنهادی است.
شکل (2): بررسی همگرایی و مجموع تداخل شبکه در 200 مرحله با تغییر تصادفی ترتیب کاربران پیروز شده در آزمایش برنولی
شکل (3): مقایسه نمودارهای توزیع مجموع تداخل کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران
در حالتهایی که تغییرات در توپولوژی شبکه یا تغییر تعداد کاربران فعال آن با فرکانس زیاد رخ دهد، عملکرد ضعیف Net-1 در حالات گذرا و همگرایی کمسرعت آن بیشتر نمایان میشود. در چنین حالاتی، کاربران زمان قابل توجهی را در حالات گذرا سپری میکنند و بر همین اساس، اهمیت عملکرد شبکه در حالات گذرا چندین برابر خواهد شد. نمودارهای شکل (3) برای بیان بهتر اطلاعات موجود در شکل (2) آورده شدهاند. در شکل (3) توزیع مجموع تداخل کاربران شبکه در هر گام در چهار حالت به نمایش در آمده است. این چهار حالت عبارتند از: توزیع مجموع تداخل کاربران در دو شبکه، در حالات گذرا و در نقاط تعادل.
شکل (4) توزیع متغیر نرخ مجموع را در همان چهار حالت بررسی شده در شکل (3) نمایش میدهد. نرخ مجموع توسط رابطه (8) تعریف میشود و به عنوان میزانی برای بازدهی یک شبکه به کار میرود [13].
(8) |
شکل (4): مقایسه نمودارهای نرخ مجموع کاربران دو شبکهدر حالات گذرا و تعادل در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران
جدول(1): بررسی پارامترهای تمرکز و پراکندگی توزیع مجموع تداخل و نرخ مجموع کاربران شبکه در حالات گذرا و تعادل در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران
|
|
Net-2 |
Net-1 |
||
|
Transient Points |
Equilibrium Points |
Transient Points |
Equilibrium Points |
|
Total Interference |
Mean |
0.0208 |
0.0169 |
0.0271 |
0.0226 |
Median |
0.0176 |
0.0169 |
0.0245 |
0.0225 |
|
Mode |
0.0172 |
0.0168 |
0.0233 |
0.0221 |
|
Range |
0.0421 |
0.0030 |
0.0416 |
0.0040 |
|
Variance |
7× 10-5 |
3 10-7 |
5× 10-5 |
6× 10-7 |
|
Sum-Rate |
Mean |
16.04 |
16.43 |
14.35 |
14.82 |
Median |
16.44 |
16.44 |
14.53 |
14.85 |
|
Mode |
16.64 |
16.83 |
15.03 |
14.96 |
|
Range |
9.13 |
1.88 |
9.65 |
1.44 |
|
Variance |
1.77 |
0.1214 |
0.88 |
0.07 |
جدول(1) نیز به توضیح عددی این شکلها کمک میکند. با توجه به شکل 3 و جدول 1 میتوان دید که Net-2 بهطور میانگین چه در نقاط تعادل و چه در نقاط گذرا به لحاظ پارامتر مجموع تداخل عملکردی حدود 30-25 % بهتر از Net-1 دارد. همچنین، با در نظر گرفتن نرخ مجموع به عنوان معیار بهینگی، Net-2 به طور میانگین چه در نقاط تعادل و چه در نقاط گذرای شبکه حدوداً 13% عملکرد مناسبتری نسبت به Net-1 دارد؛ اگر چه واریانس این متغیر که به نوعی نمایانگر میزان پراکندگی در حالات مختلف مقایسه شده این متغیر در شبکه است، در Net-2 بیشتر از Net-1 است.
برای بررسی پایداری شبکههای Net-2 و Net-1 نسبت به تغییر مکان کاربران، این دو شبکه را در 1000 توپولوژی مختلف شبیه سازی کردیم. شبیه سازیها نشان میدهند که از هر 1000 توپولوژی Net-1 در 1 تا 3 حالت از توپولوژیها ناپایدار شده، به نقطة تعادل نمیرسد. عملکردNet-2 و Net-1 در یکی از این توپولوژیها را درشکل(5) نمایش دادهایم.
شکلهای (6 و 7) هم همانند شکلهای (3 و 4) توزیع دو متغیر مجموع تداخل ونرخ مجموع را در چهار حالت مختلف مقایسه میکنند. جدول (2) نیز برای ارائه اطلاعات عددی دقیق در شکل (6 و 7) فراهم شده است. براین اساس مشاهده میگردد که Net-2 نسبت به Net-1 درحالات گذرا و نقاط تعادل به طور میانگین حدود 20% مجموع تداخل کمتری دارد؛ ضمن اینکه پراکندگی توزیع مجموع تداخل هم در Net-2 به نسبت Net-1 کمتر و مناسبتر است. به همین ترتیب، مشاهده میشود که Net-2 با معیار نرخ مجموع هم در حدود 10-7% عملکرد مناسبتری نسبت به Net-1 از خود نشان میدهد.
شکل (5): تغییرات تابع پتانسیل در دو شبکه Net-1 و Net-2 و نمایش عدم پایداری Net-2
شکل (6): مقایسه نمودارهای توزیع مجموع تداخل کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 1000 مرحله شبیه سازی با تغییر توپولوژی جغرافیایی شبکه
مقایسه عملکرد شبکه برای بررسی اثر تعداد کاربران با عملکرد خودخواهانه نیز لازم به نظر میرسد. پارامتری که برای مقایسه مناسب انتخاب شده واریانس SIR است که میتواند به عنوان معیاری برای بررسی عدالت[21] حاکم بر شبکه مطرح گردد. مشابه این کار در [5] هم انجام شده است. شکل (8) تاثیر درصد کاربران همکاری کننده (نسبت به کل کاربران) بر میزان واریانس SIR کاربران مختلف در Net-2 را نشان میدهد. دیده می شود که با افزایش میزان همکاری کاربران، میزان عدالت حاکم بر شبکه افزایش مییابد؛ اگرچه در بازه 25%-75% همکاری، میزان واریانس SIR کاربران شبکه، تا حد زیادی کنترل شده است که نشان دهندة کارآمد بودن قیمتگذاری حاکم بر شبکه به منظور القای همکاری بین کاربران است.
شکل (7): مقایسه نمودارهای توزیع نرخ مجموع کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 1000 مرحله شبیه سازی با تغییر توپولوژی جغرافیایی شبکه
جدول(2): بررسی پارامترهای تمرکز و پراکندگی توزیع مجموع تداخل و نرخ مجموع کاربران شبکه در حالات گذرا و تعادل در 1000 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران
|
|
Net-2 |
Net-1 |
||
|
Transient Points |
Equilibrium Points |
Transient Points |
Equilibrium Points |
|
Total Interference |
Mean |
0.0204 |
0.0180 |
0.0264 |
0.0226 |
Median |
0.0140 |
0.0177 |
0.0240 |
0.0221 |
|
Mode |
0.0184 |
0.0175 |
0.0227 |
0.0220 |
|
Range |
0.087 |
0.0179 |
0.0859 |
0.0270 |
|
Variance |
6× 10-5 |
6× 10-6 |
9× 10-5 |
1.4× 10-5 |
|
Sum-Rate |
Mean |
17.39 |
18.05 |
16.17 |
16.53 |
Median |
16.81 |
17.38 |
15.53 |
15.87 |
|
Mode |
14.53 |
15.5 |
13.38 |
14.39 |
|
Range |
31.38 |
28.92 |
28.08 |
24.84 |
|
Variance |
19.33 |
18.87 |
18.87 |
17.45 |
شکل (8): تاثیر درصد کاربران همکاری کننده بر واریانس SIRکاربران در Net-2
بررسی وجود بهینگی پرتو در این مقاله به وسیله شبیه سازی انجام گرفته است. شبیه سازی Net-2 با 8 عدد کاربر (8 جفت گیرنده و فرستنده) که اجازة استفاده از سه کانال برای ایجاد ارتباط خود داشتند، نشان میدهد که بعد از 1000 بار اجرای شبکه در یک توپولوژی خاص، شبکه به چهار تعادل نش همگرا میشود. تابع سود کاربران شبکه در این نقاط تعادل در شکل 8 در کنار هم قرار گرفته و مقایسه شدهاند. همانگونه که دیده می شود، منحنی تابع سود مربوط به هیچ یک از تعادل ها همواره زیر دیگری قرار ندارد. به عبارت دیگر، این نقاط تعادل همه در مرز بهینگی پرتو قرار دارند. این موضوع بهینه بودن شیوة پیشنهاد شده مدیریت یک شبکه شناختگر با مشخصات مورد نظر را نشان میدهد.
شکل (9): مقایسه تابع سود 8 کاربر شبکه در 4 تعادل
در این مقاله، یک شیوه جدید قیمتگذاری در شبکههای رادیویی شناختگر با الگوریتم دسترسی توزیع یافته ارائه شد. شیوه مطرح شده همگرایی سریع شبکه به تعادل نش را تضمین می کند، شیوه قیمتگذاری، رفتار کاربران این شبکه را کنترل می کند. چنین امری موجب بهبود قابل توجه بازدهی شبکه در تقاط تعادل شده و استفاده کارآمدتری از منابع شبکه را به همراه خواهد داشت. نتایج شبیهسازی های انجام شده نشان میدهد که مجموع تداخل شبکه به خوبی کنترل شده و نرخ مجموع افزایش می یابد. همچنین، نقاط تعادل شبکه پیشنهادی، با توجه به معیار بهینگی پرتو، بهینه خواهند بود.
تقدیر و تشکر
مؤلفان بر خود لازم می بینند از همکاری آقای مهندس سید ایمان موسوی در طول آماده سازی مقاله صمیمانه تشکر نمایند.
ضمیمه 1
فرض می کنیم یک بازی پتانسیلی کامل باشد که تابع پتانسل آن به شکل تعریف شده است. بنابراین:
اکنون بازی با کاربران خودخواه را در نظر می گیریم. با اعمال ، به عنوان تابع قیمتگذاری در بازی ، می توان تابع سود جدید در بازی را به صورت زیر نشان داد:
با در نظر گرفتن رابطه کلی زیر
و با قراردادن و و فرض مثبت به اندازه کافی بزرگ، بهطوری که همواره باشد، میتوان نوشت:
در نتیجه، بازی به همراه قیمتگذاری پیشنهادی، یک بازی پتانسیلی معمولی خواهد بود.
[1].Cognitive Radios (CR)
[2].Mitola
[3].Distributed
[4].CR dedicated net
[5].Medium Access Control
[6] Request To Send
[7] Clear To Send
[8].Pareto efficiency
[9].Sum-Rate
[10].Centralized
[11].Signaling packets
[12]Ad-hoc
[13].Rational player
[14] Utility Function
[15].Nash Equilibrium
[16].Exact Potential
[17].Ordinal Potential
[18].Finite Improvement Path (FIP)
[19].Round-robin
[20].Asynchronous
[21] Fairness