支招政治复习:学博弈论 理性思考

支招政治复习:学博弈论 理性思考,第1张

支招政治复习:学博弈论 理性思考,第2张

博弈论是研究决策主体的行为直接相互作用时的决策以及这种决策的均衡。也就是说,当一个主体的选择受到其他主体选择的影响时,就会反过来影响其他主体的决策和均衡问题。

一个完整的博弈应该包括五个方面:一是博弈的参与者,即在博弈过程中独立做出决策并承担后果的个人和组织;二是游戏信息,即玩家所掌握的有助于选择策略的信息资料;第三,游戏可以选择的所有行为或策略的集合;第四,博弈的顺序,即博弈参与者进行策略选择的顺序;第五,玩家的收益,即每个玩家做出决策后的得失。

囚徒困境

“囚徒困境”是博弈论中最经典的例子之一。讲的是两个犯罪嫌疑人(A和B)作案后被警察抓去隔离审讯;警方的方针是“坦白从宽,抗拒从严”。如果两人都坦白,各判8年;一人坦白,一人不坦白,坦白释放,不坦白者判10年;如果他们不坦白,他们将因证据不足而各被判一年。

在这个例子中,游戏的参与者是两个嫌疑人A和b,他们每个人都有两种策略,分别是招供和不招供,入狱的年限就是他们的报酬。有四种可能的情况:A和B都坦白或者都不坦白,A坦白B不坦白或者B坦白A不坦白,这是博弈的结果。A和B都承认是这个博弈的纳什均衡。这是因为,假设A选择表白,B选择表白,因为B表白8年,否认10年;假设A选择否认,B还是选择坦白,因为B坦白会因为否认被判一年而不被判刑。也就是说,无论A表白还是否认,B的选择都是表白。反过来,同样,不管B是坦白还是否认,A的选择也是坦白。结果两人都选择了坦白,各被判有期徒刑8年。在(表白,告白)的组合中,A和B都不能通过单方面的改变来增加自己的收益,所以谁都没有离开组合的动力,所以这个组合就是纳什均衡。

囚徒困境反映了个人理性和集体理性之间的矛盾。如果A和B都选择否认,就各判一年,这显然比两人都选择坦白,各判八年要好得多。当然,A和B在被警察抓到之前可以进行“攻守同盟”,但这未必有用,因为不构成纳什均衡,谁也没有遵守这个协议的主动权。

关于完全理性的思考

囚徒困境博弈的一个假设是所有参与者都是完全理性的。理性来源于经济学中理性人的假设,即游戏中的所有参与者都以个人利益为目标,他们具有准确判断和选择的能力,不会“犯错”。以个人利益为目标的叫“个人理性”,有完善的分析判断能力,选择行为不出错的叫“完全理性”。理性完整地包含了追求利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完善要求。,其中任何不完善的方面都不属于完全理性。我们可以看到这是一个非常严格的假设。即便如此,完全理性还有一个方面是没有规定的(至少是没有实现或明确规定的),那就是思维方式,即玩家思考问题的方式是分解问题的方式,还是系统的、整体的方式。

位律师回复
DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 支招政治复习:学博弈论 理性思考

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情