حل مسئلهی تعارض زندانیان
خب بپردازیم به حل مسئلهی تعارض زندانیان (Prisoner’s Dilemma).
تا اینجا این مسئله را به فرم استاندارد نوشیم و فقط حل آن باقی ماند. گفتیم مراد از حل، یافتن تعادل نش (Nash Equilibrium) است. تعادل نش یک Strategy Profile بود که یک ویژگی خاص داشت. پس یک روش برای یافتن تعادل نش این است که Strategy Profile های فضای بازی را بررسی کرده و ببینیم آیا این ویژگی را دارند یا خیر. اگر Strategy Profile ای این ویژگی را داشت در این صورت تعادل نش را یافتهایم.
اغلب در بازیهایی که تعداد Strategy Profile ها محدود است از این روش استفاده مینمایند. اطلاعات بازی را در قالب جدول ذیل برای خلاصهسازی نمایش میدهیم.
همانطور که میبینیم و قبلاً هم نوشتیم این بازی چهار Strategy Profile دارد. که هر کدام از آنها میتوانند یک تعادل نش باشند. بیاییم فرض کنیم سلول (c, c) در جدول بالا یک تعادل نش است بنابراین این Strategy Profile باید برای هر کدام از Player ها این ویژگی را داشته باشد که اگر رفتار طرف مقابل را Fix کردیم Player مورد نظر انگیزهی تخطی نداشته باشد. به چه معنا؟ به این معنا که Action ای وجود نداشته باشد که اگر Player آن Action را انتخاب کرد مطلوبیتش بیشتر از چیزی شود که در اینجا به دست آورده است. یعنی الان فرض میکنیم PlayerB ،c بازی کرده (اصطلاحاً رفتارش را Fix مینماییم.) حال یا PlayerA میتواند c بازی کند یا nc. ما فرض کردیم که این Strategy Profile تعادل نش است. پس PlayerA نباید انگیزهی تخطی داشته باشد. یعنی انتخابی ندارد که مطلوبیت بیشتری نصیبش کنند. کلاً این بازیکن دو انتخاب داشته c یا nc. اگر c بازی کند (توجه دارید که رفتار PlayerB را Fix در نظر گرفتهایم.) 4- گیرش میآید، اگر nc بازی کند 10- گیرش میآید. پس این بازیکن انگیزهی تخطی ندارد. بیاییم برای بازیکن B هم همین تحلیل را انجام دهیم. میبینیم که او نیز انگیزهی تخطی کردن ندارد. پس ما Strategy Profile ای را یافتیم که برای هر بازیکنی (اگر رفتار بقیهی بازیکنان را Fix کنیم) آن بازیکن انگیزهی تخطی ندارد. یعنی اگر رفتارش را به هر رفتار دیگری تغییر دهد چیز بیشتری عایدش نخواهد شد یا به زبان ریاضی:
u(a*) >= u (ai , a*-i)
خب حالا بقیه Strategy Profile ها را نیز بررسی کنیم ببینم آیا تعادل نش دیگری دارند یا خیر؟
حالا سلول (c, nc) را بررسی کنیم. یعنی PlayerA انتخاب c را داشته و بازیکن مقابل، انتخاب nc را. اگر رفتار بازیکن B را روی nc فیکس کنیم میبینیم بازیکن A انگیزهی تخطی از c بازی کردن ندارد. چرا؟ چون اگر به جای c بخواهد nc بازی کند مطلوبیتش از 1- به 2- تغییر خواهد کرد، یعنی مطلوبیتش کاهش خواهد یافت. پس این بازیکن انگیزهی تخطی ندارد و باید بازیکن بعدی، یعنی بازیکن B را بررسی کنیم. اگر B به جای nc، انتخاب c را داشته باشد، در اینصورت مطلوبیتش از 10- به 2- تغییر خواهد کرد، یعنی مطلوبیتش افزایش مییابد، پس انگیزهی تخطی خواهد داشت. بنابراین این Strategy Profile یک تعادل نش نیست.
Strategy Profile دیگر (nc , c) است که بررسی آن مشابه Strategy Profile بالاست. بنابراین به آن نمیپردازیم.
حالا یک Strategy Profile دیگر باقی می ماند. (nc, nc) خب اگر رفتار بازیکن B را ثابت در نظر بگیریم، بازیکن A میتواند با تغییر رفتار از nc به c، مطلوبیتش را از 2- به 1- برساند یا به عبارتی payoff اش را افزایش دهد، بنابراین، این Strategy Profile نیز یک تعادل نش نخواهد بود.
جمعبندی:
ما تمام Strategy Profile های فضای بازی را بررسی کردیم و نتیجه این بود که فقط یک تعادل نش وجود دارد و آن عبارت است از:
a* : (c, c)
یعنی از بین آیندههای محتمل در این موقعیت، آیندهای که در آن هر دو نفر چهار سال به زندان میافتند، رخ خواهد داد.