حل مسئله‌ی تعارض زندانیان

خب بپردازیم به حل مسئله‌ی تعارض زندانیان (Prisoner’s Dilemma).
تا این‌جا این مسئله را به فرم استاندارد نوشیم و فقط حل آن باقی ماند. گفتیم مراد از حل، یافتن تعادل نش (Nash Equilibrium) است. تعادل نش یک Strategy Profile بود که یک ویژگی خاص داشت. پس یک روش برای یافتن تعادل نش این است که Strategy Profile های فضای بازی را بررسی کرده و ببینیم آیا این ویژگی را دارند یا خیر. اگر Strategy Profile ای این ویژگی را داشت در این صورت تعادل نش را یافته‌ایم.
اغلب در بازی‌هایی که تعداد Strategy Profile ها محدود است از این روش استفاده می‌نمایند. اطلاعات بازی را در قالب جدول ذیل برای خلاصه‌سازی نمایش می‌دهیم.

حل مسئله‌ی تعارض زندانیان (Prisoner’s Dilemma)

همان‌طور که می‌بینیم و قبلاً هم نوشتیم این بازی چهار Strategy Profile دارد. که هر کدام از آن‌ها می‌توانند یک تعادل نش باشند. بیاییم فرض کنیم سلول (c, c) در جدول بالا یک تعادل نش است بنابراین این Strategy Profile باید برای هر کدام از Player ها این ویژگی را داشته باشد که اگر رفتار طرف مقابل را Fix کردیم Player مورد نظر انگیزه‌ی تخطی نداشته باشد. به چه معنا؟ به این معنا که Action ای وجود نداشته باشد که اگر Player آن Action را انتخاب کرد مطلوبیتش بیش‌تر از چیزی شود که در این‌جا به دست آورده است. یعنی الان فرض می‌کنیم Player_B ،c بازی کرده (اصطلاحاً رفتارش را Fix می‌نماییم.) حال یا Player_A می‌تواند c بازی کند یا nc. ما فرض کردیم که این Strategy Profile تعادل نش است. پس Player_A نباید انگیزه‌ی تخطی داشته باشد. یعنی انتخابی ندارد که مطلوبیت بیش‌تری نصیبش کنند. کلاً این بازیکن دو انتخاب داشته c یا nc. اگر c بازی کند (توجه دارید که رفتار Player_B را Fix در نظر گرفته‌ایم.) 4- گیرش می‌آید، اگر nc بازی کند 10- گیرش می‌آید. پس این بازیکن انگیزه‌ی تخطی ندارد. بیاییم برای بازیکن B هم همین تحلیل را انجام دهیم. می‌بینیم که او نیز انگیزه‌ی تخطی کردن ندارد. پس ما Strategy Profile ای را یافتیم که برای هر بازیکنی (اگر رفتار بقیه‌ی بازیکنان را Fix کنیم) آن بازیکن انگیزه‌ی تخطی ندارد. یعنی اگر رفتارش را به هر رفتار دیگری تغییر دهد چیز بیشت‌ری عایدش نخواهد شد یا به زبان ریاضی:

u(a*) >= u (a_i , a*_-i)

خب حالا بقیه Strategy Profile ها را نیز بررسی کنیم ببینم آیا تعادل نش دیگری دارند یا خیر؟
حالا سلول (c, nc) را بررسی کنیم. یعنی Player_A انتخاب c را داشته و بازیکن مقابل، انتخاب nc را. اگر رفتار بازیکن B را روی nc فیکس کنیم می‌بینیم بازیکن A انگیزه‌ی تخطی از c بازی کردن ندارد. چرا؟ چون اگر به جای c بخواهد nc بازی کند مطلوبیتش از 1- به 2- تغییر خواهد کرد، یعنی مطلوبیتش کاهش خواهد یافت. پس این بازیکن انگیزه‌ی تخطی ندارد و باید بازیکن بعدی، یعنی بازیکن B را بررسی کنیم. اگر B به جای nc، انتخاب c را داشته باشد، در این‌صورت مطلوبیتش از 10- به 2- تغییر خواهد کرد، یعنی مطلوبیتش افزایش می‌یابد، پس انگیزه‌ی تخطی خواهد داشت. بنابراین این Strategy Profile یک تعادل نش نیست.

Strategy Profile دیگر (nc , c) است که بررسی آن مشابه Strategy Profile بالاست. بنابراین به آن نمی‌پردازیم.

حالا یک Strategy Profile دیگر باقی می ماند. (nc, nc) خب اگر رفتار بازیکن B را ثابت در نظر بگیریم، بازیکن A می‌تواند با تغییر رفتار از nc به c، مطلوبیتش را از 2- به 1- برساند یا به عبارتی payoff اش را افزایش دهد، بنابراین، این Strategy Profile نیز یک تعادل نش نخواهد بود.

جمع‌بندی:
ما تمام Strategy Profile های فضای بازی را بررسی کردیم و نتیجه این بود که فقط یک تعادل نش وجود دارد و آن عبارت است از:

a* : (c, c)

یعنی از بین آینده‌های محتمل در این موقعیت، آینده‌ای که در آن هر دو نفر چهار سال به زندان می‌افتند، رخ خواهد داد.

حل مسئله‌ی تعارض زندانیان

هادی نیکو

دیدگاه‌ها