密室逃脱囚徒困境攻略(博弈问题浅谈1囚徒困境的困与解)

密室逃脱囚徒困境攻略(博弈问题浅谈1囚徒困境的困与解)

admin 2025-11-03 资讯 2 次浏览 0个评论

全文共2100余字,阅读思考约15分钟。

00、写在前面

1.本文仅代表个人观点。受个人兴趣驱使,做一个简单的思考,不涉及过多的数理逻辑。若存在问题,欢迎指正。

2.此文章的目的分为两个:

一是介绍囚徒困境的策略解,分析囚徒困境的个体选择和集体最优选择。

二是思考囚徒困境的个体解法,探究囚徒困境的破解之道:对合作的约定/约束。

3.本文只探讨非合作博弈,仅论及完全信息静态均衡。

博弈问题浅谈(1):囚徒困境的困与解

01、背景知识

简单理解传统博弈论相关知识,所需如下:

博弈:个人或组织在一定条件与既定规则下,选择策略并实施,从中获取相应利益和结果的过程。

非合作博弈:也就是我们字面上理解的“博弈”,冲突和合作并存。在既定规则下,每个人进行自主的决策,与策略环境中的其他人无关。强调个体理性而非集体理性。

完整的博弈包括:理性的参与者、博弈中的信息、参与者可选的策略集合、博弈的次序、参与方的收益。

博弈可分为:

静态博弈:双方同时或不同时选择(后选者不知先选者所采取的行为)动态博弈:双方按次序先后选择(后选者知先选者所采取的行为,如下棋)完全信息博弈:参与者对所有参与者的特征、策略等方面有完全准确的信息。不完全信息博弈:参与人并不完全清楚有关博弈的一些信息。(如打牌)

上策均衡(占优策略均衡):不管他人选择的策略,我选择的最佳策略是唯一的。双方都会选择最佳策略。

纳什均衡:任何参与者在此策略组合下都不会单方面改变自己的策略(因为会损害自身利益)。

博弈问题浅谈(1):囚徒困境的困与解

约翰·纳什,1994年获诺贝尔经济学奖

02、何为囚徒困境(Pris-oner's Dilemma)

有一天,一位富豪被杀,其家中财物被洗劫。警方在认真侦查后,抓到两个嫌疑犯A和B,但苦于缺乏充足证据,于是把他们隔离审讯。

警察知道他们有罪,于是分别告诉他们:“一人坦白,一人抵赖,抵赖10年牢饭,坦白无罪释放。两人坦白,各8年劳饭。两人抵赖,各1年劳饭”。

假如你是A或B,你会怎么选择呢?

博弈问题浅谈(1):囚徒困境的困与解

从整体来看,“双方都抵赖,各判1年"是集体最优解,这是最理想化的解决办法。但他们最终却选择“两个人都坦白,各判8年”这种集体最坏的解。为什么两人会统统坦白,傻到都选择“坦白”这种最坏的结果呢?

首先有2个假设:

A、B都是理性人,给他们两个选择,他们总会选择对自己有利的,即形成上策均衡。A、B在不知道对方所选的前提下,独自进行策略选择。

原因在此:A认为如果他坦白,对方坦白/抵赖,他会判8年/0年,对方要么和他一起8年(大不了一起),要么独自蹲10年监狱(我舒服了)。而如果他抵赖,他会判10年/1年,对方要么无罪释放(我太亏了),要么一起1年(这种情况无法串供,风险过大)。 A想了想,坦白合算(万一他抵赖,我能无罪释放了),我还是招了吧。B也是这么想的。 于是A、B都坦白,结果是都判了8年,“坦白”对他们个人来讲是最佳的,符合他们个体的理性,这是唯一的纳什均衡点,即单方面的改变不会发生。

博弈问题浅谈(1):囚徒困境的困与解

单次囚徒博弈的情况会是如此。可以看到,人类个体的理性有时导致集体的非理性。

如果A、B双方博弈的次数不仅仅只有这一次。假如在他们第一次博弈后,警官又给了他们第二次、三次……选择的机会,他们在每次博弈后都能商量10分钟。这就是多重囚徒博弈。

我们不妨分析第二次博弈。假设双方在商量10分钟后达成了一个口头协议“双方均抵赖各判1年”,双方达成攻守同盟。

进入第二次博弈,A认为既然他选择抵赖合作,那我违背协议,我选择坦白背叛,我会无罪释放/他吃10年牢饭。B也是这么认为的。 于是,两人并没有因为简单的沟通而摆脱困境。两人最终又选择了坦白。

博弈问题浅谈(1):囚徒困境的困与解

在签下协议后A或B的个人选择及对方选择所致结果

思考一下,之后的第三次、第四次……是否会有所不同?结论是双方会从互相背叛走向互相合作。但现实不允许这样对规则的试错。能在有限次重复博弈中逃脱,才是我考虑的结果。

君子爱财,取之有道,一味地算计别人,算来算去,就像上述A、B一样,结果却置自己为不利境地。

03、如何摆脱囚徒困境

首先“困境”在于,A、B明明能做到集体最优解,却因为个体利益而做出集体最坏选择。

可以思考,囚徒困境的最优解必须借助外力打破信息差,让两个囚徒能充分沟通从而形成集体的最优解。

博弈问题浅谈(1):囚徒困境的困与解

但关键在于强有力协约的制定,使双方遵守。这里我认为可以靠社会道德和国家法律去破解。

限于篇幅,我就不用专业的角度分析了。

所谓社会道德,主要有两种:一是纯文化因素起作用,现代社会随着经济的不平衡发展,有的国家道德素养高,有的低。二是传统社会的文化遗存起作用,例如西方的宗教,美国教会的人道德感更强,他们信仰诸如上帝地狱这些,还有中国的诚实守信等等。

依靠道德来打破难题,化解个人理性与社会集体理性的矛盾,能够维系整个社会的秩序和发展。但实际上,我不相信整体和他人的道德,社会道德正在异化。活在当下,实用最重要。

而国家法律,要注意这两点:效率性,在囚徒困境里,表现为对违反约定的人以强力的惩戒,越严格越好。像霍布斯所认为的,抑制他人的危害行动。 公平性,在囚徒困境里,表现为对违反者的惩罚要与违反者违反而给他人造成的危害相当。这样博弈双方违约的可能性就会小。

不失效率和公平的法律,是我推崇的破解之道。前提是有外部强制力。

04、写在最后

我对博弈论相关的书籍看得不够多,以上缺乏专业知识和理论。限于水平,难免会有不足和错误。

写文章阐述自己的思考是个麻烦事,不如看书来的放松。

推荐看《美丽心灵》这部电影,书中有对博弈知识的涉及。

注:原文载于知乎,知乎ID:Isaac-sinL

转载请注明来自Sjyct,本文标题:《密室逃脱囚徒困境攻略(博弈问题浅谈1囚徒困境的困与解)》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...