更好地学会做策略选择:博弈生存-第4章

小说：更好地学会做策略选择:博弈生存字数：每页3500字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

幸蝗盒⊥担凳┩档痢＞煲乐拐庑┬⊥档耐档粒蛭璞赣邢蓿挥幸徊烤担熘荒芤淮卧谝桓龅胤窖猜摺６杂谛⊥刀裕且仓荒苋ヒ桓龅胤健＜俣ˋ地需要保护的财产价值为2万元，B地的财产价值为1万元。若警察在某地进行巡逻，而小偷也选择了去该地，因警察在场，小偷无法偷盗该地的财物；若警察没有去某地巡逻而小偷选择了去该地，则小偷偷盗成功。警察怎么巡逻才能使效果最好？
　　一个明显的做法是，警察对A地进行巡逻，小偷去B地，这样，警察可以保住2万元的财产不被偷窃，而小偷的稳定收益为1万元。但是这种做法是警察的最好做法吗？警察有没有比这种策略更好的策略？
　　我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地，偷盗者在该地无法实施偷盗，假定此时小偷的得益为0（没有收益），此时警察的得益为3（保住3万元）。
　　这个博弈也是常和博弈，它没有纯策略纳什均衡点，而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与人的最优（混合）策略选择。
　　

小偷（1）
警察
袭击A地
袭击B地
巡逻A地
3，0
2，1
巡逻B地
1，2
3，0　　对于这个例子，警察的一个更好的策略是，警察用掷骰子的方法决定去A地还是B地。假定警察规定掷到1—4点去A地，掷到5、6两点去B地，这样警察有2/3的机会去A地进行巡逻，1/3的机会去B地。
　　而小偷的最优选择是：以同样掷骰子的办法决定去A地还是去B地偷盗，如掷到1—4点去B地，掷到5、6两点去A地，那么，小偷有1/3的机会去A地，2/3的机会去B地。
　　此时警察与小偷所采取的便是混合策略。
　　假如按这种策略，我们看一下双方的收益。警察的期望得益是：7/3万大于2。警察按此办法比只巡逻A地的收益更高。
　　一旦警察采取混合策略，小偷也采取混合策略，其最优混合策略下的收益为2/3万元。小偷的收益比警察只巡逻A地的收益要低。
　　因为：当警察去A地巡逻时，小偷有1/3的机会去A地，2/3的机会去B地，此时警察去A地的得益为：万元；当警察去B地时，同样，小偷有1/3的机会去A地，2/3的机会去B地，此时警察A地的得益为：万元。
　　警察总的得益为：万元。
　　同理，我们可得小偷的总的得益为2/3万元。
　　这里我们“让”警察和小偷掷骰子以确定去A地还是去B地，目的是要去A地和去B地之间确定一个概率分布，他们当然可用其他方式来确定这个概率分布。
　　宰割博弈中警察与小偷所用的混合策略，如同小孩子之间玩“剪刀—石头—布”的游戏时所用的策略。在“剪刀—石头—布”这样的游戏中，不存在纯策略均衡，对每个小孩来说，自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的，不能让对方知道自己的策略，哪怕是倾向性的策略。如果对方知道你出其中一个策略的可能性大，那么你在游戏中输的可能性就大。因此，每个小孩的最优混合策略是采取每个策略的可能性是1/3。在这样的博弈中，每个小孩各取三个策略的1/3是纳什均衡。
　　由此可见：纯策略是参与人一次性选取的，并且坚持他选取的策略；而混合策略是参与人在各种备选策略中采取随机选取的。在博弈中，参与人可以改变他的策略，而使得他的策略选取满足一定的概率分布。
　　若博弈是零和博弈，即若博弈参与人为两人，一方所得是另外一方的所失，或者若博弈是常和博弈，即若博弈参与人为两人，一方所得的增加等于另外一方的损失，此时，对于任何一个参与人而言，都不可能有纯策略的占优策略。博弈参与人采取混合策略是合适的，均衡为混合策略均衡。如在当前的“反恐”博弈中，由于力量的有限，反恐方往往“更多地”将力量放在重点区域，如人口密集的大城市，“一定程度地”关注不太危险的区域，如人口稀疏的农村。这就是混合策略。而恐怖分子同样在玩混合策略：对攻击对象的选择是随机的，对攻击方式的选择也是随机的。
　　在竞争性的博弈中，该采取混合策略而不采取混合策略将会带来失败。田忌赛马是人人熟悉的故事。齐王与田忌赛马，但齐王的马平均来说要比田忌的马要跑得快，但田忌采纳了孙膑的策略，田忌用下等马对齐王的上等马，上等马对齐王的中等马，中等马对齐王的下等马。田忌以三比二获胜，赢了齐王。赛马是零和博弈，齐王的失败在于他使用了纯策略；若齐王使用混合策略，即每次比赛用马采取随机策略，不让田忌预先知晓，那么田忌获胜的机会必定大大小于齐王获胜的机会，齐王不会发生必输的结局。因此，齐王的错误在于没有使用混合策略。txt电子书分享平台　

小偷（2）
应当说明的是，田忌赛马是著名的中国古代博弈故事。但其田忌获胜的博弈结果则不是博弈论所能够给出的。博弈论假定了每个参与人都是绝顶聪明的（理性的），博弈论给出的是，田忌和齐王都应采取混合策略，此时有一个混合策略均衡。田忌赛马从反面印证了纳什均衡的含义：若某个参与人主动改变均衡策略，他的收益会降低。这里，主动改变均衡策略而收益降低的参与人是齐王。
　　5．《三国演义》中的空城计与信息不对称的博弈
　　如果我们用博弈论的眼光看《三国演义》，三国演义完全是一部记载着许多博弈案例的著作。当然，罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》，这个词就是“计”。计，即计策或策略也。用计，即用策略赢对方。用计算敌，不仅要自己选择恰当的计策，而且要算准对方要用的计策，这不就是博弈？现在让我们看《三国演义》中著名的空城计博弈。
　　诸葛亮误用马谡，致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将，只有一班文官，五千军士，已分一半先运粮草去了，只剩二千五百军士在城中。众官听得这个消息，尽皆失色。孔明登城望之，果然尘土冲天，魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿，诸军各收城铺。打开城门，每一门用二十军士，扮作百姓，洒扫街道。而孔明乃披鹤氅，戴纶巾，引二小童携琴一张，于城上敌楼前凭栏而坐，焚香操琴。司马懿自飞马上远远望之，见诸葛亮焚香操琴，笑容可掬。司马懿顿然怀疑其中有诈，立即叫后军作前军，前军作后军，急速退去。司马懿之子司马昭问：“莫非诸葛亮无军，故作此态，父亲何故便退兵？”司马懿说：“亮平生谨慎，不曾弄险。今大开城门，必有埋伏。我兵若进，中其计也。”孔明见魏军退去，抚掌而笑，众官无不骇然。诸葛亮说，司马懿“料吾生平谨慎，必不弄险；见如此模样，疑有伏兵，所以退去。吾非行险，盖因不得已而用之”，我兵只有二千五百，若弃城而去，必为之所擒。
　　这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。
　　这里，司马懿不知道自己和对方在不同行动策略下的支付，而诸葛亮是知道的，他们对博弈结构的了解是不对称的，诸葛亮拥有比司马懿更多的信息。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。
　　在这里，孔明可以选择的策略是“弃城”或“守城”。无论孔明所选择的是“弃”还是“守”，只要司马懿明确知道在各种可能的情况下他自己的支付，那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿清楚地知道他自己的策略结果。孔明通过空城计，目的是降低司马懿进攻的可能收益，使得司马懿认为，后退比进攻要好。
　　

司马懿
孔明
进攻
后退
守城
被擒；大胜
逃脱；不胜不败
弃城
被擒；大胜
逃脱；不胜不败
　　
　　在信息不充分的情况下，理性的博弈参与人不是使自己的支付或效用最大，而是使自己的“期望支付（或效用）”最大。比如：如果让你在“有50％的可能获得100元”与“有10％的可能获得200元”两者之间进行选择，你当然选前者，因为前者的“期望所得”为：50％×100=50元，而后者为：10％×200元=20元。理性的人是选择前者的。
　　在孔明—司马懿的博弈中，孔明了解双方的局势，制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说，诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时，在司马懿看来，进攻失败的可能性较大，而退兵的期望效用大于进攻的期望效用。即：司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法，才能让司马懿退兵。
　　司马懿想，诸葛亮一生谨慎，不做险事，只有设定埋伏才可能如此镇定自若，焚香操琴。此时，司马懿觉得“退”比“进攻”更合理，或者说期望效用更大。于是后军变前军，前军变后军，后退而去。结果是诸葛亮得以逃脱。司马懿对局势的判断不是没有道理的，他对诸葛亮的判断是基于以前的认识，这就是“归纳法”，我们会在第七章中讨论归纳法在博弈中的作用及其局限。
　　空城计博弈是不完全信息博弈，我们说过《三国演义》是一本博弈实战教材，在该书中有完全信息博弈实例吗？当然，曹操与诸葛亮的华容道博弈就是一个完全信息博弈。
　　曹操亲领八十万大军进攻东吴，孙权和刘备联合破曹，曹军大败。曹操引兵而逃。经过一路厮杀，来到一处，军士报：前方有两条道路，请问丞相走哪条路？曹操问：哪条路近？军士说：大路稍平，却远五十余里。小路投华容道，却近五十多里。曹操令人上山观望，回报：小路山边有数处狼烟，大路并无动静。曹操叫走华容道。诸将问：烽烟起处必有军马，何故反走这条路？曹操说：岂不闻兵书有云：“实则虚之，虚则实之”。诸葛亮多谋，故使人于山僻放烟，使我军不敢从这条路走，他却伏兵于大路等着。吾已料定，偏不教中他计。诸将皆曰：丞相妙算，人不可及。遂曹兵走华容道。但关羽依着诸葛亮的妙计在华容道等着曹操，于是关羽上演了一场“只为当初恩义重，放开金锁走蛟龙”的捉放曹的义举。逃过华容道大难，曹操只剩二十七骑！
　　在曹操与诸葛亮之间的这一华容道博弈中，曹操的策略是在走华容道还是走大路之间进行选择，而诸葛亮派关羽埋伏时，要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。
　　这个博弈如同猜硬币的游戏一样，是一个“零和博弈”5它没有纯策略纳什均衡点。双方对博弈有完全的信息，各种策略下的博弈支付是公共知识——我们下一章将说明什么是公共知识。但双方无法知道对方的策略选择，而只能进行猜测。曹操要选择走诸葛亮的军队不在的路，这是他的最优的结果。而诸葛亮的最优结果是埋伏在曹操要走的路上。
　　　电子书　分享网站

曹操
诸葛亮
华容道
大路
华容道
捉住曹操，被捉
白等，逃脱
大路
白等，逃脱
捉住曹操，被捉
　　
　　
　　
　　诸葛亮制造埋伏

返回目录上一页下一页回到顶部赞（2）踩（2）

第4章

更好地学会做策略选择:博弈生存-第4章

你可能喜欢的