دوره 13 (1401)
دوره 12 (1400)
دوره 11 (1399)
دوره 10 (1398)
دوره 9 (1397)
دوره 8 (1396)
دوره 7 (1395)
دوره 6 (1394)
دوره 5 (1393)
دوره 4 (1392)
دوره 3 (1391)
دوره 2 (1390)
دوره 1 (1389)
تبانی ضمنی در بازی های غیر مشارکتی مکرر با استفاده از الگوریتم یادگیری تقویت N گام جلوتر
تبانی ضمنی در بازی های غیر مشارکتی مکرر با استفاده از الگوریتم یادگیری تقویت N گام جلوتر

امین گلزاری هرمزی؛ سید حسین خواسته؛ امیرحسین نیکوفرد؛ زهرا شیرمحمدی

دوره 12، شماره 4 ، دی 1400، ، صفحه 1-12

http://dx.doi.org/10.22108/isee.2020.121990.1345

چکیده
  در تئوری بازی، راه حل شناخته شده برای به دست آوردن حداکثر سود در بازی های تکرار نشده تا حد ممکن، تعادل نش است. با این حال، در برخی از بازی های غیر مشارکتی مکرر، بازیگران می توانند با تبانی ضمنی به سود بیشتری ...  بیشتر