بازی تخیلی
تاریخچه[ویرایش]
بازی ساختگی یا همان بازی تخیلی روشی است که توسط جورج براون در سال ۱۹۵۱ تعریف شد، این بازی شامل بازی با مجموع صفر است و هر بازیکن بهترین پاسخ را به استراتژی حریف خود می دهد. هدف این روش یافتن مقدار بازی به روشی تکراری است. می دانیم زمانی که مشکل پیچیده می شود، طبق معمول روش های تکرار شونده آسان تر از روش های تحلیلی محاسبه می شوند. براون ابتدا بازی ساختگی را به عنوان توضیحی برای بازی تعادلی نش (مفهومی در نظریه بازیها) معرفی کرد. او تصور میکرد که یک بازیکن، بازی را در ذهن خود "شبیه سازی" میکند و بازی آینده خود را بر اساس این شبیهسازی به روز میکند. به همین جهت هم آن را "بازی ساختگی" نامیدند. البته که با توجه به کاربرد امروزه این نظریه، این نام کمی اشتباه به نظر میرسد چرا که هر بازی در واقعیت انجام میشود و ساختگی نیست.[۱]
مقدمه[ویرایش]
بازی ساختگی یک قانون یادگیری در نظریهی بازی است که اولین بار توسط جورج ویلیامز براون معرفی شد. در آن، هر بازیکن فرض میکند که حریفان در حال بازی کردن استراتژیهای ثابت (احتمالا ترکیبی) هستند. بنابراین در هر دور، هر بازیکن بهترین پاسخ را با توجه به سوابق پیشین حریف خود می دهد. چنین روشی، اگر حریف واقعاً از یک استراتژی ثابت استفاده کند، کافی است، در حالی که اگر استراتژی حریف ثابت نباشد، ناقص است. برای مثال، استراتژی حریف ممکن است مشروط به آخرین حرکت بازیکن ساختگی باشد.[۲]
بازی تخیلی و یادگیری تقویتی[ویرایش]
اولین قدم برای درک بازی های تک نفره در یادگیری تقویتی، یادگیری مفهوم بازی ساختگی است. این مفهوم با یادگیری تقویتی یک چارچوب کلی و موثر برای بازی هاییست که مجموع شان صفر است. با این حال، با استفاده از مدلهای شبکه عصبی عمیق فعلی، اجرای بازی ساختگی با چالشهای حیاتی مواجه است. آموزش مدل شبکه عصبی از رویکردهای نزولی گرادیان برای به روزرسانی تمام وزن های اتصال استفاده میکند و بنابراین به راحتی می توان حریفان قدیمی را پس از تمرین برای شکست دادن حریفان جدید فراموش کرد. [۳]
خواص همگرایی[ویرایش]
در بازی ساختگی، اگر در هر دوره زمانی، همه بازیکنان یک تعادل نش را بازی کنند، در تمام دورهای بعدی این کار را انجام خواهند داد. [۲]به علاوه، اگر بازی ساختگی به هر توزیعی همگرا شود، آن احتمالات با تعادل نش در بازی اصلی مطابقت دارد.[۲]
بنابراین سوال جالب این است که بازی ساختگی در چه شرایطی همگرا می شود؟ این روند برای یک بازی 2 نفره همگرا می شود اگر:
1. هر دو بازیکن فقط تعداد محدودی استراتژی دارند و بازی مجموع صفر است. [۴]
2. بازی با حذف مکرر استراتژی های کاملاً تحت سلطه قابل حل است. [۵]
3. این بازی یک بازی بالقوه است.[۶][۷]
4. این بازی دارای بازده عمومی است و 2 × N است. [۱]
با این حال، بازی ساختگی همیشه همگرا نیست. Shapley در سال 1964 ثابت کرد که در نسخهای با مجموع غیر صفر از سنگ کاغذ قیچی، بازی میتواند وارد چرخهای بیپایان شود.[۸]
بازی تخیلی دو نفره[۲][ویرایش]
مدل بازی ساختگی فرض می کند که بازیکنان اقدامات خود را در هر دوره انتخاب می کنند تا با توجه به پیش بینی یا ارزیابی آنها از توزیع اقدامات حریف در آن دوره، سود مورد انتظار آن دوره را به حداکثر برسانند، و این ارزیابی شکل ویژهای را به خود می گیرد.
توجه داشته باشید که یک قانون بازی ساختگی منحصر به فرد وجود ندارد، زیرا ممکن است بیش از یک بهترین پاسخ به یک ارزیابی خاص وجود داشته باشد. تحلیلهای سنتی فرض میکنند که بازیکن وقتی بین چندین استراتژی خالص بیتفاوت باشد، بهترین پاسخ را با استراتژی خالص انتخاب میکند. از آنجایی که بیتفاوتی دقیقی برای پرداختهای عمومی و پیشینیها رخ نمیدهد، این که از چه مشخصاتی استفاده میشود، اهمیتی ندارد. همچنین توجه داشته باشید که رفتار تجویز شده توسط بازی ساختگی تابعی ناپیوسته از ارزیابی بازیکن است، زیرا به طور کلی انتخاب مستمری از مکاتبات با بهترین پاسخ وجود ندارد.
در بازی ساختگی، اگر توزیعهای تجربی بر روی انتخابهای هر بازیکن همگرا شوند، نمایه استراتژی مربوط به حاصل ضرب این توزیعها یک تعادل نش است.
واژه شناسی[ویرایش]
برگر بیان میکند که «آنچه نظریه پردازان بازی های مدرن به عنوان «بازی ساختگی» توصیف میکنند، فرآیند یادگیری نیست که جورج براون در مقاله خود در سال ۱۹۵۱ معرفی کرد.[۱]
نسخهی اصلی براون در جزئیات ظریفی متفاوت است. در استفاده مدرن امروزه، بازیکنان به طور همزمان باورهای خود را به روز میکنند در حالی که براون این روند را به طور متناوب انجام میدهد. سپس برگر از شکل اصلی براون برای ارائه یک اثبات ساده و شهودی از همگرایی در مورد بازیهای بالقوه ترتیبی غیرمنحط دو نفره استفاده میکند.
اصطلاح "ساختگی" قبلاً در تئوری بازی ها معنای دیگری داشت. جان فون نویمان و اسکار مورگنشترن در سال 1944، "بازیکن ساختگی" را به عنوان بازیکنی با تنها یک استراتژی تعریف کردند که به یک بازی با n بازیکن اضافه میشود تا آن را به یک بازی با n+1 بازیکن با مجموع صفر تبدیل کند.[۹]
تفسیر چرخهها در بازی تخیلی[ویرایش]
تعاریف اولیه در مورد بازی ساختگی، این فرآیند را به عنوان توصیف محاسبات پیش از بازی توصیف می کند که ممکن است بازیکنان برای هماهنگ کردن انتظارات خود در مورد بازی تعادلی نش خاص استفاده کنند (از همین رو نیز به این بازی "ساختگی" می گویند). از سوی دیگر هنگام استفاده از بازی ساختگی به عنوان وسیلهای برای محاسبه تعادل نش، شناسایی یک چرخه با میانگین زمانی آن مشکل ساز نیست، چرا که تعاریف اولیه در مورد بازی ساختگی بر همین اساس، بر یافتن شرایطی متمرکز شده است که توزیع های تجربی را تضمین می کند. [۲][۱]
با این حال، این مفهوم همگرایی به عنوان معیاری برای اینکه آیا بازیکنان یاد گرفتهاند که استراتژیهای مربوطه را بازی کنند یا خیر، مشکلاتی دارد، زیرا فرض میکند که بازیکنان تداوم چرخهها را نادیده میگیرند و بازی حریفان که با متغیرهای تصادفی مستقل و توزیع شده یکسان مطابقت دارد، از یک توزیع ثابت گرفته شده است. علاوه بر این، با وجود این چرخهها، توزیع تجربی «مشترک» بازی دو بازیکن را میتوان معنا کرد. در برخی نظریهها به دلیل مشکلاتی که داریم، یک راه حل جایگزین این است که تصمیم بگیریم نادیده گرفتن چرخه ها توسط بازیکنان مشکل ساز نیست زیرا بازیکنان فقط داده های مربوط به دفعات بازی حریف را پیگیری می کنند.[۲][۳]
منابع[ویرایش]
- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ ۲٫۵ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ ۳٫۰ ۳٫۱ SALLOUM, Ziad (2021-12-12). "Introduction to Fictitious Play". Medium (به English). Retrieved 2023-05-12.صفحه پودمان:Citation/CS1/en/styles.css محتوایی ندارد.
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ L.، Shapley (۱۹۶۴). M. Dresher, L.S. Shapley, and A.W. Tucker (Eds.). «"Some Topics in Two-Person Games"». Advances in Game Theory.صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
- ↑ «Theory of Games and Economic Behavior». Princeton and Woodstock. Princeton University Press. ۱۹۴۴ – به واسطهٔ von Neumann and Morgenstern.صفحه پودمان:Citation/CS1/fa/styles.css محتوایی ندارد.
This article "بازی تخیلی" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:بازی تخیلی. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.