Designing a potential game via pricing for optimal resource management in non-cooperative Cognitive Radio networks

Document Type : Research Article

Authors

Department of electrical engineering, Faculty of Engineering,University of Isfahan, Isfahan, Iran

Abstract

In this paper, based on the game theory, an optimized resource management algorithm for cognitive radio networks has been presented. Considering the personal interests, each user selects its own desired utility function and competes for channel and power selection. This non-cooperative approach is controlled through an appropriate pricing method. We have shown that if the profit function in a cooperative potential game is used as the pricing function in a non-cooperative network, the game governing the non-cooperative network will also become potential and will thus converge to Nash equilibrium. If the network is designed based on the cooperation of the users, the existence of selfish users among them will make the network be unstable. Besides, it decreases resource utilization gain. Using the recommended pricing has been shown to equilibrate the network. In simulations, by studying parameters like sum-rate of network and its total interference, it is shown that the resource utilization will be improved. Simulation results show that the equilibrium points also enjoy some optimality criteria such as Pareto optimality.

Keywords


با افزایش کاربرد سیستم‌های مدرن بی سیم مخابراتی لزوم هوشمند سازی در آنها افزایش می‌یابد. از سوی دیگر، اندازه‌گیری ها و آزمایش‌های انجام شده در سال‌های اخیر توسط FCC بهینه نبودن بهره­وری طیف فرکانسی را نمایان می‌کند [2]. رادیوهای شناختگر[1](CR) سیستم‌های هوشمندی هستند که برای بهره برداری صحیح از طیف فرکانسی ابداع شده‌اند. میتولا[2] نخستین کسی بود که ایدة رادیوهای شناختگر را بدین صورت عنوان کرد [2] :

"رادیو شناختگر نمادی است برای یک سیستم استدلال گر که به منظور رسیدن به حد مطلوبی از یک یا چند پارامتر مخابراتی طراحی شده است."

یکی از توانایی‌های مهم رادیوهای شناختگر مشاهدة لحظه به لحظة طیف فرکانسی و امکان یافتن باند مناسب برای ایجاد ارتباط مورد نظر است. بدین وسیله یک رادیوی شناختگر قادر خواهد بود از باند فرکانسی که مجوز استفاده از آن را کاربر دیگری داراست، استفاده نماید (در صورتی که برای دارندة مجوز مزاحمتی در ارتباط رادیویی ایجاد نکند). البته، فقط مناسب بودن نسبت سیگنال به نویز و تداخل برای برقراری ارتباط مناسب بین کاربران کافی نیست، بلکه با توجه به مفهوم دمای تداخلی، چگالی توان در باند مورد نظر نیز نباید از حد مجاز بیشتر شود. شبکه رادیویی تشکیل شده از رادیوهای شناختگر، با نام شبکه رادیویی هوشمند نیز شناخته می­شود. علاوه بر خصوصیات مناسب رادیوهای شناختگر که به قسمتی از آن اشاره شد، امتیازاتی هم برای شبکه‌های رادیویی هوشمند قابل شمارش است. از جمله می توان به امکان برقراری ارتباط بین تعداد زیادی گره به صورت کاربر محور، درآمدزایی برای کاربران دارای مجوز به وسیلة اجاره دادن طیف فرکانسی که در اختیار دارند و امکان تخصیص مناسب منابع شبکه به کاربران شبکه‌های بدون سیم اشاره نمود [3].

در این مقاله مدیریت و بهینه سازی یک شبکه رادیویی شناختگر نوعی با استفاده از نظریه بازی بررسی قرار می‌شود. در این شبکة کاربران لزومی به پیروی از یک مرکز کنترل یا برقراری ارتباط از طریق آن را نداشته، از یک الگوریتم توزیع شده[3] که برای اداره شبکه طراحی شده است پیروی می‌کنند. کاربران شبکه مختارند با توجه به چارچوب‌های شبکه و با توجه به ترجیحات شخصی دربارة نوع ارتباط خود به شیوة دلخواه تصمیم گیری کنند. بنابراین کاربران شبکه به صورت پیش فرض خودخواه در نظر گرفته شده‌اند. در شبکه مورد بررسی با تمامی کاربران بدون مجوز همانند یک کاربر دارای مجوز برخورد می‌شود و شبکه خالی از رادیوهای دارای مجوز است. چنین شبکه‌ای را یک شبکه اختصاص یافته به کاربران بدون مجوز می‌نامند[4]. چنین شبکه هایی در مطالعات مختلف بررسی شده‌اند. در [4] مشکلاتی که در پیاده­سازی این گونه شبکه‌ها وجود دارد، ذکر شده و تعدادی از مشخصات به عنوان مشخصات کلیدی لازم برای پروتکل ادارة شبکه بیان شده است. در [5] و [6]، توابع سودی معرفی شده است که در صورت رعایت شدن آنها توسط کاربران شبکه، همکاری بین کاربران القا می‌گردد.

پروتکل MAC [5] ارائه شده در [5]، که شباهت زیادی به تبادل بسته‌های اطلاعاتی RTS/CTS بر اساس استاندارد IEEE802.11 دارد، توانایی اجرای الگوریتم مورد نظر را داراست. به طور خلاصه، در این روش فرستنده بسته­ای به نام RTS[6] به گره مقصد ارسال می کند و گره مقصد با ارسال بسته CTS [7] برای دریافت اطلاعات اعلام آمادگی می­نماید. دیگر گره های موجود در شبکه، پس از دریافت این دو بسته، مدتی در ارسال اطلاعات خود توقف می‌نمایند. یکی از نقاط ضعف طرح‌های ارائه شده در [5] و [6] اجبار کردن نوع تابع سود به کاربران شبکه است. چنین چیزی خارج از توان ناظر شبکه بوده یا حداقل به شبکه‌ای با کاربران همکاری کننده نیاز دارد و در شبکه‌ با کاربران خودخواه قابل اجرا نیست. برای تحلیل این شرایط به سازوکارهایی برای بررسی انطباق عملکرد کاربران با تابع سود معرفی شده به آنها نیاز است که موجب پیچیدگی اجرا و پیاده سازی طرح مورد نظر خواهد شد.

در شبکه‌هایی که توزیع منابع شبکه به صورت غیر مرکزی و توزیع یافته صورت می‌گیرد، از قیمت گذاری به عنوان اهرمی برای افزایش همکاری میان کاربران شبکه استفاده می‌شود. در [7] و [10] از یک شیوة قیمت گذاری خطی استفاده شده است. مزیت چنین قیمت گذاری را می‌توان سادگی مفهوم و پیاده سازی آسان آن عنوان کرد. در [10] با استفاده از انتخاب ضریب قیمت­گذاری مناسب، بهبود وضعیت شبکه با توجه به معیار بهینگی پرتو[8] مورد نظر قرارگرفته است.همچنین، یک قیمت­گذاری بهینه نیز ارائه شده که پیچیدگی پیاده­سازی زیادی دارد. یک شیوة قیمت‌گذاری پیشرفته‌تر، قیمت­گذاری تطبیق یافته است که در آن ضریب قیمت­گذاری برای هر کاربر شبکه‌، (بر اساس شرایط نهایی مطلوب) عددی خاص و متفاوت با دیگر کاربران باشد [8]. این شیوه به نزدیک شدن تعادل به بهینگی پرتو کمک می کند. در [8] یک الگوریتم واترفیلینگ بر مبنای قیمت­گذاری ارائه شده است. این شیوه به صورت توزیع شده قابل اجرا بوده، می‌توان از آن برای مدیریت شبکه‌های غیرهمکارانه استفاده کرد. نوع دیگر از قیمت‌گذاری تطبیق یافته در [9] ارائه شده است. به علاوه، الگوریتم واترفیلینگ [8] و [9] ارتقا یافته است.

در این مقاله‌ نشان می‌دهیم که اگر تابع سود یک شبکه با بازی پتانسیلی همکارانه، با اصلاح اندکی به عنوان تابع قیمت‌گذاری در یک شبکه غیر همکارانه به کار گرفته شود، به پتانسیلی شدن بازی حاکم بر شبکه منجر خواهد شد. به طور مشخص، از تابع سود پیشنهاد شده در [5] به عنوان تابع قیمت‌گذاری شبکه غیرهمکارانه استفاده می‌کنیم. فرض می‌کنیم هر کاربر با توجه به منفعت خویش تابع سود شخصی خود را، که مطابق با ترجیحات اوست، انتخاب کند. تابع سود نهایی هر کاربر از حاصل جمع تابع سود شخصی او و تابع قیمت­گذاری به دست خواهد آمد. بدین ترتیب، استفاده از این روش بر خلاف الگوریتم ارائه شده در [5]، در یک شبکه غیرهمکارانه امکان پذیر است. به کارگیری تابع قیمت­گذاری معرفی شده موجب پتانسیلی شدن بازی حاکم بر شبکه می شود. در یک بازی پتانسیلی، همگرایی بازی به تعادل نش در تعداد محدودی گام از شروع بازی تضمین شده است [13]. شبیه سازی‌های عددی و رایانه‌ای انجام شده، بهینگی پرتو و میزان مناسبی از مجموع تداخل کاربران بر یکدیگر و نرخ مجموع[9] را برای تمام تعادل های این بازی نشان می‌دهد که گواهی برای اثبات کارایی و مناسب بودن الگوریتم ارائه شده است. این مقاله به شکل زیر سازماندهی شده است. در بخش 2 مفهوم کلی نظریه بازی و قابلیت‌‌های آن در طراحی شبکه های رادیویی هوشمند بیان شده است. در بخش 3 ساختار شبکه مورد بررسی و به دنبال آن در بخش 4 مدل‌سازی آن با استفاده از نظریه بازی را بیان کرده­ایم. بخش 5 به ارائه نتایج شبیه سازی و توضیح مزیت‌های حاصل شده بر اثر قیمت‌گذاری پیشنهادی اختصاص دارد و نهایتا جمع بندی مقاله در بخش 6 انجام شده است.

 

1-  نظریه بازی

نظریه بازی یک ابزار ریاضی است که می‌تواند به خوبی برخوردهای میان تعدادی فرد یا گروه تصمیم گیرنده را مدل سازی کند. این نظریه کاربرد فراوانی در اقتصاد خرد داشته، و به تازگی مورد توجه علوم مهندسی نیز قرار گرفته است. نظریه بازی در مدیریت، طراحی و تحلیل شبکه‌های رادیویی شناختگر نیز کاربرد فراوان دارد. با این ابزار، امکان طراحی الگوریتم‌های توزیع شده یا متمرکز[10] اختصاص منابع، بررسی شبکه‌های همکارانه یا غیرهمکارانه یا مهندسی کردن پروتکل MAC شبکه میسر می­شود [11]. عللی را که نظریه بازی اهمیت چشمگیری در بررسی شبکه‌های شناختگر پیدا کرده، می‌توان بدین صورت برشمرد [12]:

-          انطباق محیط یک شبکة شناختگر با عناصر موجود در نظریه بازی؛

-          توانایی نظریه بازی در حل مسأله‌هایی چند منظوره (ابزار و قضایای زیادی در نظریه بازی برای بررسی و حتی اندازه گیری بهینگی تعادل‌های بازی، که در آن سود تعداد زیادی فرد یا گروه بایستی در نظر گرفته شود، وجود دارد)؛

-          وجود مفهوم بازی‌های غیرهمکارانه در نظریه بازی که این امکان را فراهم می کند تا بتوان با استفاده از آن به بررسی شبکه‌های توزیع یافته و غیر مشارکتی پرداخت.

در یک شبکه رادیویی شناختگر، کاربران معمولا برای رسیدن به اهداف مورد نظر خود، خودخواهانه و بر اساس ترجیحات شخصی عمل می­کنند. نظریه بازی به ما اجازه می‌دهد تا تابع سودی به هر کاربر نسبت دهیم و بدین وسیله مدلی برای شیوة اتخاذ استراتژی هر کاربر داشته باشیم. بررسی نقاط تعادل شبکه (در صورت وجود) از ملاحظات ناظر و طراح شبکه است. نقاط تعادلی که بهینه بوده و در آن، شبکه دارای مشخصات مخابراتی مناسبی باشد، بهترین نشانة یک الگوریتم کارآمد توزیع منابع هستند.

 

2-  ساختار شبکه

شبکة مورد نظر ما یک شبکة رادیویی شناختگر شامل K جفت کاربر با توانایی ارسال و دریافت اطلاعات است که در  کانال به ارسال اطلاعات می‌پردازند. کاربران به صورت تصادفی در یک فضای  پراکنده شده‌اند. فاصلة میان فرستنده و گیرندة یک کاربر (یک جفت) کمتر از  فرض شده است. ضمناً توپولوژی شبکه در هر اجرا ثابت در نظر گرفته شده؛ بدین معنا که سرعت احتمالی جابه‌جایی کاربران شبکه در زمان همگرایی شبکه تغییر محسوسی در توپولوژی آن پدید نمی­آورد. تعدادی از مشخصه‌های لازم یک شبکه بدون سیم اختصاص یافته به رادیوهای شناختگر را می توان بدین صورت برشمرد [4]:

-توانایی ارسال اطلاعات حتی در گیرنده‌ها؛

-محدودیت‌ داشتن کاربران در انتخاب توان ارسالی برای کنترل تداخل کلی شبکه؛

-امکان ارسال بسته‌های سیگنالینگ[11] میان کاربران برای ایجاد محیطی که در آن کاربران توانایی برقراری ارتباط به صورت اقتضایی[12] را با یکدیگر داشته باشند.

در شبکة مورد بررسی، توان ارسالی کاربران بین دو مقدار مینیمم و ماکزیمم محدود می­شود. همچنین، شبکه دارای تعدادی کانال برای ارسال داده و یک کانال کنترلی مشترک است. از طریق کانال کنترلی کاربران می‌توانند بسته‌های سیگنالینگ خود را ارسال و دیگر کاربران را از موقعیت و شرایط خود باخبر کنند. این کار در شبکه­های بدون مدیریت مرکزی، برای استفاده بهینه از منابع شبکه و برقراری اتصال مناسب بین کاربران لازم است. کسب اطلاعات کلیه کاربران، همچنین، می‌تواند موجب امکان پذیر شدن مدیریت شبکه از جانب ناظر گردد؛ از جمله برای ارائۀ شیوه قیمت‌گذاری بهینه، اغلب به اطلاعات جامعی از تمامی کاربران شبکه نیاز است. البته، جمع آوری کلیه اطلاعات کاربران یک شبکه که با یک الگوریتم توزیع شده اداره می گردد، دشوار بوده، به پیچیدگی و در نتیجه افزایش هزینه مدیریت شبکه می­افزاید. این توضیح ضروری است که توزیع شده بودن الگوریتم صرفا به معنای این است که یک مرکز کنترل و تصمیم گیری متمرکز وجود ندارد و به هیچ وجه به معنای بی قاعده بودن شبکه نیست، بلکه باید مکانیسمی برای مدیریت شبکه وجود داشته باشد که در غالب پروتکل MAC شبکه پیاده سازی می‌گردد. الگوریتم‌های ارائه شده در [5] و [6] و قیمت­گذاری های ارائه شده در [8] و [10] با داشتن اطلاعات محدود محلی از کاربران، که از طریق سیگنالینگ در کانال کنترلی قابل دسترسی است، شبکه را به سمت تعادل های بهینه یا نزدیک به بهینه می­برد. الگوریتم ارائه شده در این مقاله نیز قابلیت پیاده­سازی به صورت توزیع شده را داراست و تنها به اطلاعات محلی کاربران نیاز دارد که از طریق کانال کنترلی قابل دریافت هستند.

 

3- مدل سازی با استفاده از نظریه بازی

 فعل و انفعالات میان کاربران شبکه برای انتخاب کانال و توان ازسالی را به صورت دوبازی غیر همکارانه به شکل  و  تعریف می‌کنیم که در آنها  مجموعة محدودی متشکل از K بازیکن با رفتار منطقی[13] است (یک بازیکن منطقی بازیکنی است که استراتژی خود را براساس افزایش تابع سود خود تغییر می‌دهد، نه کاهش آن و یا کاهش تابع سود دیگر بازیکنان).  فضای استراتژی کل بازیکنان بوده، استراتژی  به صورت زیر بیان می شود.

(1)

 

 

 بیانگر توانی است که کاربر j ام در کانال i ام ارسال می‌کند. تعداد کانال­ها M است. اگر  صفر باشد؛ یعنی توسط کاربر j ام در کانال i ام توانی ارسال نمی‌شود. همچنین، فرض می شود . ستون i‌ام ماتریس S را  می‌نامیم که نشان دهنده بازی بازیکنi ام است. هر بازیکن فقط در یک کانال توان ارسال می کند. به عبارت دیگر، در هر  فقط یک مؤلفه غیر صفر وجود دارد که آن را  می نامیم.  نیز تابع سود[14] بازیکن i ام است.

بازی ای را در نظر بگیرید که در آن تابع سود کاربران به شکل  بوده و  با رابطه زیر تعریف می شود:

(2)

 

 

در این رابطه داریم :

 

 

 نشان دهندة بهره کانال میان فرستندة i ام و گیرندة j ام است. فرض می شود که کانال تغییرات زمانی ندارد و مقادیر  با داشتن توپولوژی شبکه به صورت یکتا به‌دست می‌آید.

در رابطه (2) منظور از  مجموعه استراتژی تمام کاربران بجز کاربر i ام است.  مجموع تداخل ایجاد شده توسط کاربر i ام روی بقیه کاربران بعلاوه تداخل ایجاد شده بقیه کاربران روی کاربر i ام را نشان می­دهد.  ، یک تابع سود مناسب و معرفی شده از جانب طراح شبکه است که کاربران آن شبکه موظف به انتخاب استراتژی خود بر این اساس هستند. کاربرانی که برخورد همکارانه داشته باشند، این تابع را به عنوان تابع سود خود پذیرفته، بر همین اساس بازی می‌کنند. شبکه ای که همه کاربران آن از تابع سود  استفاده کنند، در [5] بررسی شده است. نشان داده شده است که در این حالت بازی حاکم بر شبکه پتانسیلی شده، همگرایی سریع به تعادل نش اتفاق می­افتد؛ ضمنا در تعادل های بررسی شده میزان SIR کاربران شبکه بهبود یافته است. به عبارت دیگر  یک تابع سود مناسب است که در صورت همکاری کاربران، به نتایج بسیار مناسبی منجر می­شود.

در یک محیط غیرهمکارانه تعدادی از کاربران به علت ترجیحات شخصی، استراتژی خود را بر اساس توابع سود متفاوت انتخاب می‌کنند. این بازیکنان را اصطلاحاً بازیکنان خودخواه می­نامیم. تابع ، را که در رابطه (3) تعریف شده است، می­توان به عنوان مثالی از تابع سود کاربران خودخواه شبکه در نظر گرفت.

(3)

 

 

صورت کسر در این تابع، خودخواهانه بودن انتخاب استراتژی این کاربران را نشان می‌دهد. در حقیقت، کاربری که  را به عنوان تابع سود خود انتخاب می‌کند انتخاب بیشترین توان ارسالی را مناسب می‌بیند؛ اگر چه این امر موجب ایجاد تداخل بیشتر روی دیگر کاربران باشد. فرض کنیم در بازی  کاربرانی که رویکرد همکارانه دارند، از  و کاربران خودخواه از توابع سود شخصی خود استفاده کنند. شبکه مربوط به بازی  را Net-1 می‌نامیم. روشن است که در Net-1 مزایای ذکر شده قبلی وجود نخواهد داشت. یک راه کنترل کیفیت در چنین شبکه هایی قیمت­گذاری است [8]. با اضافه کردن قیمت­گذاری مشخصی به Net-1 مدل دیگری را در نظر می‌گیریم و آن را Net-2 می­نامیم.  بازی حاکم بر این شبکه را نشان می‌دهد که در آن کاربران برای انتخاب توابع سود آزادند. در این حالت از جانب ناظر شبکه اجباری در انتخاب تابع سود اعمال نمی‌شود، بلکه از تابع  (که در Net-1 به عنوان تابع سود مطلوب فرض شده بود) با ضریب مناسب به عنوان تابع قیمت‌گذاری استفاده می‌شود.

اساسی­ترین مفهومی از نظریه بازی که از آن برای تحلیل بازی های غیرهمکارانه استفاده می‌شود، تعادل نش[15] است. پس از رسیدن به تعادل نش، هیچ کاربری استراتژی خود را تغییر نمی­دهد. به همین علت، برای مقایسه دو شبکه به مقایسه تعادل­های نش آنها خواهیم پرداخت. برای این منظور، نخستین گام اطمینان حاصل کردن از همگرایی دو بازی مورد نظر به تعادل نش است. بدیهی است بازی‌‌ای که به تعادل نش همگرا نشود و دائماً در حال تغییر باشد، اطلاعات معناداری برای مقایسه به دست نمی‌دهد. بازی پتانسیلی دسته‌ای از بازی‌هاست که در اکثر انواع آن همگرایی بازی تضمین شده است [13].

 

3-1-  بازی پتانسیلی

یکی از مهمترین چالش‌ها در شبکه رادیوهای شناختگر، ایجاد خصوصیت انطباق پذیری در شبکه های شناختگر است. همگرایی شبکه شناختگر به یک نقطه تعادل می‌تواند فراهم آورنده این خصوصیت باشد. شبکه­ای که به سرعت قابلیت رسیدن به یک تعادل را داراست، می تواند خود را به خوبی با تغییراتی که رخ می‌دهد، وفق دهد [14]. بعلاوه، وجود تعادل نش به طراح بازی اجازه پیش بینی حالات بازی و اعمال شیوه های بهینه­سازی برای ارتقای سطح نقاط تعادل را خواهد داد.

بازی‌های پتانسیلی از جمله بازی‌هایی هستند که وجود تعادل نش برای آنها ثابت می­شود. اگر در یک بازی پتانسیلی کامل یا معمولی با بازیکنان منطقی، در هر مرحله از بازی تنها یک بازیکن اجازة تغییر استراتژی خود را داشته باشد، همگرایی به تعادل نش قطعی است [13]. از مفهوم بازی پتانسیلی در حیطة شبکه‌های شناختگر استفاده فراوانی شده است [6]. دو نوع مهم بازی‌های پتانسیلی عبارتند از: بازی پتانسیلی کامل[16] و بازی پتانسیلی معمولی[17]. بازی  یک بازی پتانسیلی کامل نامیده می‌شود؛ اگر تابع  وجود داشته باشد، به طوری‌که شرط زیر را برآورده کند:

(4)

 

 

همچنین  یک بازی پتانسیلی معمولی خوانده می‌شود؛ اگر

(5)

 

 

اصطلاحا تابع  تابع پتانسیل بازی خوانده شود. در یک بازی پتانسیلی، هر بازیکن قابلیت تغییر مقدار تابع پتانسیل شبکه را دارد. به علاوه باید دقت کرد که تابع پتانسیل شبکه الزاماً تابع سود جمعی بازیکنان یک بازی را نمایش نمی‌دهد، بلکه اندازة پیشرفت بازی به سمت تعادل نش را آشکار می‌سازد [13].

نشان داده شده است که بازی‌های تخصیص توان در شبکه از طریق تابع سود  حداقل یک بازی پتانسیل معمولی خواهند بود [14] و [15]. همچنین، در [5] نشان داده شده است که بازی کاهش تداخل جمعی بر مبنای تابع سود  یک بازی پتانسیلی کامل است. در این بازی تابع پتانسیل به شکل زیر به‌دست آمده است.

(6)

 

 

این نکته قابل توجه است که بازی ای که در آن کاربران ترکیبی از دو تابع سود  و  را استفاده می‌کنند (همانند ) الزاماً حتی پتانسیلی معمولی هم نیست [14].

 

3-2- قیمت‌گذاری

وجود کاربران خودخواه در یک شبکه غیرهمکارانه بازدهی شبکه را کاهش خواهد داد؛ مگر اینکه کاربران به نحوی محدود و یا مجبور به همکاری شوند. از قیمت‌گذاری می‌توان به عنوان یک اهرم برای ترغیب بازیکنان به همکاری و تضمین رسیدن به تعادل و ارتقای بهینگی نقطة تعادل شبکه استفاده کرد [8] و [10]. شبکه‌های Net-1 و Net-2 شبکه های غیرهمکارانه هستند. در Net-2 از تابع  به عنوان تابع قیمت‌گذاری استفاده می‌شود (  یک ضریب ثابت بزرگتر از صفر است). بدین ترتیب، تابع  به عنوان تابع سود بازیکن i ام در  به شکل زیرخواهد بود.

(7)

 

 

که  تابع شخصی سود هر کاربر است؛ در حالتی که کاربر به‌صورت همکارانه بازی کند  و در غیر این صورت برابر تابع سود شخصی آن کاربر است. قیمت‌گذاری بدین شکل موجب می‌شود هر کاربر ایجاد تداخل کمتر با دیگر کاربران را به طور غیر مستقیم در ملاحظات خود قرار دهد و در نتیجه، نوعی همکاری بین کاربران القا می‌گردد. می‌توان نشان داد بازی حاکم بر Net-2 یک بازی پتانسیلی معمولی بوده و بنابراین همگرا می‌شود (ضمیمه 1). بعلاوه شبیه سازی‌ها نشان می‌دهد نقاط تعادل شبکه نیز به نقاط بهینه نزدیک است.

 

3-3- دسترسی به منابع شبکه

الگوریتم دسترسی کاربران به منابع شبکه باید استفاده کارآمد از منابع شبکه و رسیدن به همگرایی را تضمین کند. بدین منظور، مشابه با [5]، یک کانال کنترلی مشترک میان تمام کاربران در نظر گرفته شده که به آنها اجازة دسترسی به اطلاعاتی از قبیل توان ارسالی و شماره کانال یا کانال‌هایی را که دیگر کاربران در آن به ارسال اطلاعات مشغولند، می‌دهد. وجود اطلاعات کانال کنترلی به یک رادیوی شناختگر اجازه می‌دهد تا بتواند تابع  را در هر حالت از شبکه محاسبه کند.

دسترسی کاربران به منابع شبکه نیز به‌صورت چند مرحله ای فرض می­شود؛ بدین معنا که پس از اجرای هر گام از بازی، در صورتی که کاربران شبکه هنوز سودی در تغییر استراتژی خود داشته باشند، بازی ادامه خواهد یافت تا زمانی که به بازی به تعادل برسد. کاربران در مدل پیشنهادی ملزم به انتخاب استراتژی نهایی خود در یک مرحله نیستند و تا زمانی که امکان سود بیشتر وجود دارد، اجازة تغییر استراتژی دارند. نشان داده شده است که تعادل نش در بازی‌های تک مرحله‌ای در مقایسه با بازی چند مرحله ای با توجه به معیارهای مختلف، از بهینگی کمتری برخوردار است [17].

در یک بازی پتانسیلی معمولی، در صورتی که بازیکنان منطقی بوده و در هر مرحله از بازی تنها یک بازیکن اجازة تغییر استراتژی خود را داشته باشد، یک مسیر متناهی پیشرفت[18] وجود دارد [18]. در حقیقت، طبق روابط (4) و (5) تغییر استراتژی بیش از یک بازیکن در یک گام بازی ممکن است موجب افت تابع پتانسیل و در نتیجه دور شدن از همگرایی گردد. بنابراین، لازم است در هر گام بازی تنها یک کاربر اجازة تغییر استراتژی خود را داشته باشد. دو نوع الگوریتم دسترسی قطعی و تصادفی به کانال کنترلی در [5] و [6] استفاده شده است. در روش راند- رابین[19] با ایجاد یک صف دایروی، در هر مرحله تنها یک کاربر اجازه تغییر استراتژی خود را پیدا می کند. این روش قطعی بوده و فقط در حالتی که مدیریت متمرکز در شبکه موجود باشد، قابل پیاده سازی است. در روش دیگر هر کاربر شبکه با انجام یک آزمایش برنولی با احتمال  اجازۀ تغییر استراتژی خود را خواهد یافت (K تعداد کاربران شبکه است). این شیوه که غیر همزمان[20] نامیده شده است، برای مدیریت توزیع شده مناسبتر است [6]. به کار گیری این شیوه اگر چه به نسبت روش راند-رابین همگرایی شبکه را کند می کند، ولی احتمال تغییر استراتژی چند کاربر به طور همزمان را به طور قابل توجهی کاهش می دهد.

 

3-4- پروتکل MAC

پروتکل مورد استفاده MAC همان پروتکل ارائه شده در [5] است. برای مدیریت شبکه، جدول حالتی شامل اطلاعات توان و کانال انتخابی هر زوج فرستنده- گیرنده و بهره­های کانال تشکیل می شود که همه کاربران از طریق کانال کنترلی به این جدول دسترسی دارند. هر فرستنده، با انجام آزمایش برنولی و در صورت موفق بودن آزمایش با استفاده از این جدول، به محاسبه تابع سود خود به ازای تمامی استراتژی‌های ممکن پرداخته، بهترین استراتژ‌ی را انتخاب می کند. پس از انتخاب استراتژی، جدول مربوط توسط کاربر برنده به­روز می شود. برنده شدن در آزمایش برنولی و تغییر در جدول حالت از طریق سیگنالینگ مناسب به اطلاع سایر کاربران خواهد رسید.

 

3-5- بهینگی پرتو

در بازی‌هایی که تعداد بازیکنان آنها زیاد بوده، دامنة انتخاب آنها در استراتژی وسیع است، تعداد نقاط تعادل زیاد خواهد بود. در چنین وضعیتی، این سؤال پیش خواهد آمد که کدام یک از این تعادل‌ها نسبت به بقیه برتری دارد و یا از رخ دادن کدام یک از تعادل‌ها باید به نحوی اجتناب نمود. معیارهای مختلفی برای بررسی بهینگی نقطة تعادل موجود است. در شبکه های رادیویی شناختگر معیارهایی چون ظرفیت شبکه [6] ، نسبت سیگنال به تداخل کاربران شبکه [5]، نرخ مجموع شبکه در نقطه تعادل [9-8] و سرعت همگرایی شبکه [5] و [6] و [8] برای بررسی کارآمد بودن شبکه مورد توجه قرار گرفته اند. برخی دیگر از این معیارها را نظریه بازی در اختیار ما قرار می دهد؛ از جمله می‌توان به مجموع توابع سود بازیکنان یک بازی [10]، مجموع وزن دار توابع سود بازیکنان [8] و بهینگی پرتو [5] و [8] و [10] اشاره کرد.

 

تعریف بهینگی پرتو

 را تابع سود بازیکن i ام ( ) ومجموعة  را به عنوان مجموعة نقاط تعادل نش یک بازی در نظر بگیرید. تعادل  یک تعادل بهینه پرتو نامیده می­شود؛ اگر نتوان تعادل دیگری مثل s را یافت به طوری که  به عبارت دیگر تعادل بهینه پرتو آن تعادلی است که در بازی، تعادلی دیگر وجود نداشته باشد که در آن همة بازیکنان بازی سود بیشتری کسب کنند. مرز بهینگی پرتو در تعادل‌های یک بازی عبارت است از مجموعة تمام  که تعادل بهینه پرتو هستند.

در بازی‌هایی که تعدادی تعادل بهینة پرتو وجود دارد و تعدادی دیگر از تعاد‌ل‌های نش بازی بهینة پرتو نیستند، طراح بازی تلاش خواهد کرد با استفاده از ابزار‌هایی؛ از جمله قیمت­گذاری، بازی‌های تکراری و ... هر چه بیشتر بازی را به سمت تعادل‌های بهینه پرتو سوق دهد. قرار داشتن تعادل‌های یک بازی در مرز بهینگی پرتو، نشان دهندة کارآمد بودن قواعد حاکم بر بازی است.

 

4- نتایج شبیه سازی

4-1- ارزیابی اثر قیمت‌گذاری بر کیفیت

در این قسمت رفتار دو شبکه Net-2 و Net-1 با استفاده از شبیه سازی رایانه‌ای بررسی می‌شود. به علت وجود کاربران خودخواه، Net-1 در بعضی حالات اصلا همگرا نمی­شود. برای امکان پذیر شدن مقایسه، حالاتی از Net-1 در نظر گرفته شده‌اند که در آنها همگرایی رخ داده است. تعداد کاربران با رفتار غیرهمکارانه در هر دو بازی  و  یکسان و برابر 50 درصد کل کاربران در نظر گرفته شده است. در  تابع  را به عنوان تابع سود کاربران خودخواه در نظر گرفته‌ایم تا نمایانگر رفتار غیرهمکارانه آنها در بازی باشد. ساختار شبکه در بخش 3 توضیح داده شد. در شبیه سازی ،  و  فرض شده است. مقدار  نیز برابر 50m در نظر گرفته شده است.  و  به ترتیب مقادیر1 و 2 هستند. برای تعیین نوبت تغییر استراتژی، کاربران از آزمایش برنولی مشابه آنچه در بخش 4-3 گفته شد استفاده می­کنند.

شکل (1) نتیجه شبیه سازی Net-2 و Net-1 را در شرایط کاملاً یکسان نمایش می‌دهد. هر منحنی در این شکل قرینة مجموع تداخل کل کاربران شبکه یا همان مقدار ذکر شده در رابطة (6) را در طی گام­های بازی­های  و  نشان می­دهد. در ضمیمه 1 نشان داده شده که این تابع، با لحاظ ضریب مناسب، تابع پتانسیل بازی  نیز هست.

 

شکل (1): روند تغییر تابع پتانسیل در Net-1 و Net-2

 

همان طور که از رابطة (6) مشخص است، اندازة تابع پتانسیل بازی در هر گام متناسب با قرینة مجموع تداخل کل کاربران شبکه است. در یک بازی پتانسیلی، اندازه تابع پتانسیل به‌طور مداوم افزایش می­یابد. بر همین اساس، شکل (1) نه تنها پتانسیلی نبودن  را نشان می‌دهد، بلکه نمایانگر بهبود مجموع تداخل کاربران در Net-2 نیز هست.

شکل(2) رفتار دو شبکة Net-2 و Net-1 را در 200 مرتبه شبیه سازی که در آنها ترتیب برندگان آزمایش‌های برنولی، به طور تصادفی تغییر می‌کنند، نشان می‌دهد. همان‌گونه که مشاهده می‌شود، نوسان‌های Net-1 در مقایسه با Net-2 قبل از همگرایی و در حالت گذرا بسیار زیاد بوده و بعلاوه دیده می‌شود که اندازة تابع پتانسیل Net-2 در اکثر نقاط بیشتر از Net-1 است و همگرایی نیز در Net-2 سریعتر رخ می‌دهد. برای مقایسه تاثیر تابع قیمت­گذاری، روش قیمت­گذاری معرفی شده در [10] نیز استفاده شده و نتایج به‌طور همزمان در شکل(2) نشان داده شده است. از مقایسه نتایج مربوط می‌توان به این نکته اشاره نمود که هر چند به‌طور کلی قیمت‌گذاری ابزاری برای کنترل رفتار کاربران است، ولی این بدان معنی نیست که هرگونه قیمت‌گذاری عملکرد مناسبی داشته باشد.

نتایج به‌دست آمده نمایانگر کارآمد بودن روش قیمت‌گذاری پیشنهادی است.

 

شکل (2): بررسی همگرایی و مجموع تداخل شبکه در 200 مرحله با تغییر تصادفی ترتیب کاربران پیروز شده در آزمایش برنولی

 

 

شکل (3): مقایسه نمودارهای توزیع مجموع تداخل کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران

 

 

در حالت­هایی که تغییرات در توپولوژی شبکه یا تغییر تعداد کاربران فعال آن با فرکانس زیاد رخ ‌دهد، عملکرد ضعیف Net-1 در حالات گذرا و همگرایی کم‌سرعت آن بیشتر نمایان می‌شود. در چنین حالاتی، کاربران زمان قابل توجهی را در حالات گذرا سپری می‌کنند و بر همین اساس، اهمیت عملکرد شبکه در حالات گذرا چندین برابر خواهد شد. نمودارهای شکل (3) برای بیان بهتر اطلاعات موجود در شکل (2) آورده شده‌اند. در شکل (3) توزیع مجموع تداخل کاربران شبکه در هر گام در چهار حالت به نمایش در آمده است. این چهار حالت عبارتند از: توزیع مجموع تداخل کاربران در دو شبکه، در حالات گذرا و در نقاط تعادل.

شکل (4) توزیع متغیر نرخ مجموع را در همان چهار حالت بررسی شده در شکل (3) نمایش می‌دهد. نرخ مجموع توسط رابطه (8) تعریف می‌شود و به عنوان میزانی برای بازدهی یک شبکه به کار می‌رود [13].

(8)

 

 

 

 

 

شکل (4): مقایسه نمودارهای نرخ مجموع کاربران دو شبکهدر حالات گذرا و تعادل در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران

جدول(1): بررسی پارامترهای تمرکز و پراکندگی توزیع مجموع تداخل و نرخ مجموع کاربران شبکه در حالات گذرا و تعادل در 200 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران

 

 

Net-2

Net-1

 

Transient Points

Equilibrium Points

Transient Points

Equilibrium Points

 

 

Total Interference

Mean

0.0208

0.0169

0.0271

0.0226

Median

0.0176

0.0169

0.0245

0.0225

Mode

0.0172

0.0168

0.0233

0.0221

Range

0.0421

0.0030

0.0416

0.0040

Variance

7× 10-5

3 10-7

5× 10-5

6× 10-7

 

 

Sum-Rate

Mean

16.04

16.43

14.35

14.82

Median

16.44

16.44

14.53

14.85

Mode

16.64

16.83

15.03

14.96

Range

9.13

1.88

9.65

1.44

Variance

1.77

0.1214

0.88

0.07


جدول(1) نیز به توضیح عددی این شکل‌ها کمک می‌کند. با توجه به شکل 3 و جدول 1 می‌توان دید که Net-2 به‌طور میانگین چه در نقاط تعادل و چه در نقاط گذرا به لحاظ پارامتر مجموع تداخل عملکردی حدود 30-25 % بهتر از Net-1 دارد. همچنین، با در نظر گرفتن نرخ مجموع به عنوان معیار بهینگی، Net-2 به طور میانگین چه در نقاط تعادل و چه در نقاط گذرای شبکه حدوداً 13% عملکرد مناسبتری نسبت به Net-1 دارد؛ اگر چه واریانس این متغیر که به نوعی نمایانگر میزان پراکندگی در حالات مختلف مقایسه شده این متغیر در شبکه است، در Net-2 بیشتر از Net-1 است.

برای بررسی پایداری شبکه‌های Net-2 و Net-1 نسبت به تغییر مکان کاربران، این دو شبکه را در 1000 توپولوژی مختلف شبیه سازی کردیم. شبیه سازی‌ها نشان می‌دهند که از هر 1000 توپولوژی Net-1 در 1 تا 3 حالت از توپولوژی‌ها ناپایدار شده، به نقطة تعادل نمی‌رسد. عملکردNet-2 و Net-1 در یکی از این توپولوژی‌ها را درشکل(5) نمایش داده‌ایم.

شکل‌های (6 و 7) هم همانند شکل‌های (3 و 4) توزیع دو متغیر مجموع تداخل ونرخ مجموع را در چهار حالت مختلف مقایسه می‌کنند. جدول (2) نیز برای ارائه اطلاعات عددی دقیق در شکل (6 و 7) فراهم شده است. براین اساس مشاهده می‌گردد که Net-2 نسبت به Net-1 درحالات گذرا و نقاط تعادل به طور میانگین حدود 20% مجموع تداخل کمتری دارد؛ ضمن اینکه پراکندگی توزیع مجموع تداخل هم در Net-2 به نسبت Net-1 کمتر و مناسبتر است. به همین ترتیب، مشاهده می­شود که Net-2 با معیار نرخ مجموع هم در حدود 10-7% عملکرد مناسبتری نسبت به Net-1 از خود نشان می‌دهد.

 

 

شکل (5): تغییرات تابع پتانسیل در دو شبکه Net-1  و Net-2 و نمایش عدم پایداری Net-2

 

 

 

شکل (6): مقایسه نمودارهای توزیع مجموع تداخل کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 1000 مرحله شبیه سازی با تغییر توپولوژی جغرافیایی شبکه

 

 

مقایسه عملکرد شبکه برای بررسی اثر تعداد کاربران با عملکرد خودخواهانه نیز لازم به نظر می­رسد. پارامتری که برای مقایسه مناسب انتخاب شده واریانس SIR است که می­تواند به عنوان معیاری برای بررسی عدالت[21] حاکم بر شبکه مطرح گردد. مشابه این کار در [5] هم انجام شده است. شکل (8) تاثیر درصد کاربران همکاری کننده (نسبت به کل کاربران) بر میزان واریانس SIR کاربران مختلف در Net-2 را نشان می­دهد. دیده می شود که با افزایش میزان همکاری کاربران، میزان عدالت حاکم بر شبکه افزایش می‌یابد؛ اگرچه در بازه 25%-75%  همکاری، میزان واریانس SIR کاربران شبکه، تا حد زیادی کنترل شده است که نشان دهندة کارآمد بودن قیمت­گذاری حاکم بر شبکه به منظور القای همکاری بین کاربران است.

 

 

 

 

شکل (7): مقایسه نمودارهای توزیع نرخ مجموع کاربران دو شبکه Net-1 و Net-2 در حالات گذرا و ماندگار در 1000 مرحله شبیه سازی با تغییر توپولوژی جغرافیایی شبکه

 

 

 

 

جدول(2): بررسی پارامترهای تمرکز و پراکندگی توزیع مجموع تداخل و نرخ مجموع کاربران شبکه در حالات گذرا و تعادل در 1000 مرحله شبیه سازی با تغییر ترتیب تصمیم گیری کاربران

 

 

Net-2

Net-1

 

Transient Points

Equilibrium Points

Transient Points

Equilibrium Points

 

 

Total Interference

Mean

0.0204

0.0180

0.0264

0.0226

Median

0.0140

0.0177

0.0240

0.0221

Mode

0.0184

0.0175

0.0227

0.0220

Range

0.087

0.0179

0.0859

0.0270

Variance

6× 10-5

6× 10-6

9× 10-5

1.4× 10-5

 

Sum-Rate

Mean

17.39

18.05

16.17

16.53

Median

16.81

17.38

15.53

15.87

Mode

14.53

15.5

13.38

14.39

Range

31.38

28.92

28.08

24.84

Variance

19.33

18.87

18.87

17.45

 

 

 

 

شکل (8): تاثیر درصد کاربران همکاری کننده بر واریانس SIRکاربران در Net-2

4-2- ارزیابی بهینگی

بررسی وجود بهینگی پرتو در این مقاله به وسیله شبیه سازی انجام گرفته است. شبیه سازی Net-2 با 8 عدد کاربر (8 جفت گیرنده و فرستنده) که اجازة استفاده از سه کانال برای ایجاد ارتباط خود داشتند، نشان می‌دهد که بعد از 1000 بار اجرای شبکه در یک توپولوژی خاص، شبکه به چهار تعادل نش همگرا می‌شود. تابع سود کاربران شبکه در این نقاط تعادل در شکل 8 در کنار هم قرار گرفته و مقایسه شده‌اند. همان‌گونه که دیده می شود، منحنی تابع سود مربوط به هیچ یک از تعادل ها همواره زیر دیگری قرار ندارد. به عبارت دیگر، این نقاط تعادل همه در مرز بهینگی پرتو قرار دارند. این موضوع بهینه بودن شیوة پیشنهاد شده مدیریت یک شبکه شناختگر با مشخصات مورد نظر را نشان می‌دهد.

شکل (9): مقایسه تابع سود 8 کاربر شبکه در 4 تعادل

 

5- نتیجه‌گیری

در این مقاله، یک شیوه جدید قیمت­گذاری در شبکه‌های رادیویی شناختگر با الگوریتم دسترسی توزیع یافته ارائه شد. شیوه مطرح شده همگرایی سریع شبکه به تعادل نش را تضمین می کند، شیوه قیمت‌گذاری، رفتار کاربران این شبکه را کنترل می کند. چنین امری موجب بهبود قابل توجه بازدهی شبکه در تقاط تعادل شده و استفاده کارآمدتری از منابع شبکه را به همراه خواهد داشت. نتایج شبیه‌سازی های انجام شده نشان می‌دهد که مجموع تداخل شبکه به خوبی کنترل شده و نرخ مجموع افزایش می یابد. همچنین، نقاط تعادل شبکه پیشنهادی، با توجه به معیار بهینگی پرتو، بهینه خواهند بود.

 

تقدیر و تشکر

مؤلفان بر خود لازم می بینند از همکاری آقای مهندس سید ایمان موسوی در طول آماده سازی مقاله صمیمانه تشکر نمایند.

 

ضمیمه 1

فرض می کنیم  یک بازی پتانسیلی کامل باشد که تابع پتانسل آن به شکل  تعریف شده است. بنابراین:

 

 

 

 

اکنون بازی  با کاربران خودخواه را در نظر می گیریم. با اعمال ، به عنوان تابع قیمت‌گذاری در بازی ، می توان تابع سود جدید در بازی  را به صورت زیر نشان داد:

 

با در نظر گرفتن رابطه کلی زیر

 

و با قراردادن  و  و فرض  مثبت به اندازه کافی بزرگ، به‌طوری که همواره  باشد، می‌توان نوشت:

 

 

 

 

 

 

در نتیجه، بازی  به همراه قیمت­گذاری پیشنهادی، یک بازی پتانسیلی معمولی خواهد بود.

 



[1].Cognitive Radios (CR)

[2].Mitola

[3].Distributed

[4].CR dedicated net

[5].Medium Access Control

[6] Request To Send

[7] Clear To Send

[8].Pareto efficiency

[9].Sum-Rate

[10].Centralized

[11].Signaling packets

[12]Ad-hoc

[13].Rational player

[14] Utility Function

[15].Nash Equilibrium

[16].Exact Potential

[17].Ordinal Potential

[18].Finite Improvement Path (FIP)

[19].Round-robin

[20].Asynchronous

[21] Fairness

 
[1]          J. Yang, “Spatial Channel Characterization for Cognitive Radios,” MS, EECS Department, University of California, Berkeley, January2005.
[2]          J. Mitola “Cognitive Radio, Model-based Competence for Software Radios,” Licentiate Thesis (Stockholm: KTH) September1999.
[3]          A. Attar, O. Hollandd, M.R. Nakhai, “Interference-Limited Resource Allocation for Cognitive Radio in Orthogonal Frequency-Division Multiplexing Networks”, IET, Communications, Vol.2, Issue.6, pp.806-814, Jul 2008.
[4]          W. Lehr, J. Crowcroft, “Managing Shared Access to a Spectrum Commons”, 2005 New Frontiers in Dynamic Spectrum Access Networks, 2005 1st Symp.
[5]          N. Nie, C. Comaniciu, “Adaptive channel allocation spectrum etiquette for cognitive radio networks”, Mobile Networks and Applications, pp. 779–797, 2006.
[6]          M. Canales, J.R. Gallego, “Potential Game for joint Channel and Power Allocation in Cognitive Radio Networks”, IET Electronics Letters, Vol.46, Issue.24, pp.1632-1634, 2010
[7]          J. Mwangoka, K. Letaief, Z. Cao,“Joint power control and spectrum allocation for cognitive radio networks via pricing”, Physical Communication Vol.2, Issue 2, pp.103–115, 2009.
[8]          F. Wang, M. Krunz, S. Cui, “Price-Based Spectrum Management in Cognitive Radio Networks”, IEEE Journal of Selected Topics in Signal Processing, Vol.2, Issue.1, pp.74-87, Feb 2008
[9]          B. Kollimarala, Q. Cheng, “Adaptive Pricing for Efficient Spectrum Sharing in MIMO Systems”, 2010 IEEE 71st Conference on Vehicular Technology (VTC 2010-Spring),.
[10]          C.U. Saraydar, N.B. Mandayam, “Efficient Power Control via Pricing in Wireless Data Networks”, IEEE Transactions on Communications, Vol. 50, Issue 2, pp. 291-303, Feb 2002.
[11]          B. Wang, Y. Wu, K.J. Ray Liu, “Game Theory for Cognitive Radio Networks and Distributed Radio Resource Management Algorithms”, Blacksburg, VA, Sep 2006.
[12]          E. Hossain and D. Niyato and Z. Han, “dynamic spectrum access and management in cognitive radio networks”, pp. 237-24, CAMBRIDGE University press, 2009.
[13]          J. O. Neel, “Analysis and Design of Cognitive Radio Networks and Distributed Radio Resource Management Algorithms”, PhD thesis, Blaksburg, VA, Sep 2006.
[14]          J. O. Neel, J. H. Reed, R. P. Gills, “Convergence of Cognitive Radio Networks”, Wireless Communications and Networking Conference, 2004 IEEE.
[15]          J. Neel, J. Reed, R. Gilles, “The Role of Game Theory in the Analysis of Software Radio Networks, in: SDR Forum Technical Conference, Nov 2002.
[16]          J. Neel, R. Gilles, J. Reed, “Properties of Ordinal Potential Games”, MPRG Technical Document 86753, Jul 2003.
[17]          L. Grokop, D. Tse, “Spectrum Sharing Between Wireless Networks”, IEEE/ACM Trans on Networking, Vol.18, Issue 5, pp. 1401-1412, Oct 2010
[18]          D. Monderer, L. Shapley, “Potential Games”, Elsevier Games and Economic Behavior, Vol. 14, Issue 1, pp.124-143, 1996.