更好地学会做策略选择:博弈生存-第5章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
电子书 分享网站
曹操
诸葛亮
华容道
大路
华容道
捉住曹操,被捉
白等,逃脱
大路
白等,逃脱
捉住曹操,被捉
诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。这里关键是谁能真正猜到
对方的策略,谁就是赢家。诸葛亮胜曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。
6.约定与协调博弈
先看一个道路通行博弈。
道路是浪费土地的,因为它的建设需要占用土地;道路又是节约土地的,因为若没有道路的方便人们将践踏更多的土地。随着人口的增多,道路在增加,道路上行走的车辆和行人也越来越多。道路上的行人和车辆有来有往,若没有交通规则,情况会如何?
假设在某条道路上向相反方向行驶的两辆车在某处相遇。若它们均走自己的“左边”、或均走自己的“右边”,它们则能顺利通过;而如果一辆车走自己的“左边”、另外一辆车走自己的“右边”,它们均不能通过,甚至发生相撞。我们设不能通过(或相撞)的支付为0,顺利通过的支付为1,该道路通行博弈的博弈支付矩阵如下:
乙
甲
左
右
左
1,1
0,0
右
0,0
1,1 该博弈有两个纳什均衡是,这两辆车都走“左边”,或都走“右边”。
我们已经说过,若一个博弈只有一个纳什均衡,该均衡是可预测的。在这样的博弈中的参与人能够自动地在该纳什均衡处实现。而博弈一旦出现两个或两个以上的纳什均衡,博弈结果是什么,我们无法预测。该博弈道路通行博弈也一样,我们不能预先知道,两个司机选择的最后结果。
在这个道路通行博弈中,这两辆车的司机均希望能够顺利通过,均不希望发生堵车甚至相撞的尴尬情况出现。但是对每个司机而言,他应当选“左”还是“右”呢?若他知道对方的选择,他很容易地作出自己的选择,但对方与他处于同样的决策境地。预测对方的选择是正确决策的基础,而司机发生预测错误是可能的,因此发生不能顺利通过是可能的。6
在实际中人们是如何避免此尴尬情况出现的呢?其方法众所周知。那就是,确定交通规则。交通规则规定人们在交通行走中一律“靠左行”,或一律“靠右行”。是“靠右行”还是“靠左行”在不同国家有不同的规定。“靠右行”还是“靠左行”,没有优、劣之分,重要的是在一个固定的区域了必须有一致的规定。一旦在某个区域了这样的规定成为公共知识,那么,在一般情况下不会发生堵车甚至相撞的悲剧了。
该交通通行博弈的特点是,存在多个纳什均衡点,参与人希望在其中任何一个纳什均衡点上实现各自的最大收益。这样的博弈称为协调博弈。
在协调博弈中,可通过某个约定而协调参与人的行动,使博弈的某个均衡点得以实现。
再来看一个协调博弈。
有几个学生决定不参加星期一的考试。他们周末离开学校去郊区游玩,周二才回来。回来后,他们向教授解释说,在回来的路上他们汽车轮胎爆了,没有备用轮胎。他们出示了他们所住的郊区旅馆的收据,上面有日期,以证明周末他们确实在郊区。他们恳请教授给他们重新安排一次考试。我们假定有四个学生。
教授同意给他们一个补考的机会。学生们在教室的四个角落就坐,他们为他们成功欺骗暗自窃喜。教授说考试内容只需回答一个问题,教授在黑板上写下这样的问题:“你们所驾驶的车子的四个车轮的轮胎中哪一个坏了?”
这是一个协调博弈。车子有四个轮胎,因而,每个学生都有四个备选答案:前左、前右、后左、后右。若四个学生的答案一致,那么他们便通过考试,否则便没有通过考试。
若他们的故事是真实的,他们的回答将是一致的。每个学生都会指出那个爆了的轮胎。若故事是编造的,他们可以通过事先的“约定”而使答案一致,而若没有这样的约定,所有四个学生均答出同一个轮胎的概率很低,概率只有,读者可以来验证这个结果。7教授出人意料地给出这个问题,学生很难预测到该问题而进行预先对回答进行“约定”。
在生活中这样的协调博弈随处可见。比如,儿童在商场里走失,儿童与父母相互寻找便是一个协调博弈。在商场中,父母与儿童往往有多个可能的所在地点(比如楼层)可选择,若父母与儿童所选择的是同一楼层,他们将相遇,这是他们希望的;若父母与儿童所选择了楼层不同,他们将不能相遇,这是他们努力避免的。为了防止走散而相遇不到的情况,父母与儿童可以事先进行约定,一旦走失,一起去往共同认识的某处,比如某一楼层或某一个特殊的柜台,此时便能够出现希望出现的博弈结果。对于这样的博弈,很可能的是父母与儿童事先没有进行约定。如果没有进行约定,最好的方法是双方根据双方所拥有的公共知识而选择对方最可能的地方(事先的约定也是公共知识)。比如,儿童这样想,一起来到商场是为了购买某种商品,父母最有可能在该商品所在的地方;父母也会这样想,孩子会认为我们会在购买商品的地方……这里我们假定了儿童具有一定的推理能力,否则的话,这里的分析是不合适的。
。 想看书来
公共知识与博弈(1)
博弈专家们发现在博弈中涉及到群体认知的刻画问题。公共知识便是一种群体认知。要弄清什么是公共知识,首先要弄清什么是知识。
知识是人的真信念。这样,我们就把知识与信念区分了开来。知识是人们对自然中某个事实的认识,我们说某人拥有某种知识,意指某人知道某个事实。人们知道的东西是以命题表达的,人们拥有某个知识是说他相信某个真命题。“地球绕着太阳转”这个命题在今天看来表达了一个真的事实,但哥白尼之前的许多人并认为它表达真的事实,而今天这个命题表达的事实已几乎被所有人熟知,并且人们相信这个命题,于是“地球绕着太阳转”构成人们的知识。
因此,知识涉及三个因素:
第一,人们所相信的命题要是真的。假的命题不能成为知识。人们可能相信虚假的东西,但它们不能构成相信它们的人的知识。在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当然只是错误的信念,而不是知识。再比如:在古代,中国人认为雷电是由掌管雷电的雷公行云布雨的结果,这当然也不是真的事实。假的信念对信念拥有者的行为指导有时可能是有效的,但它不构成相信者的知识。知识能够经受检验,而假的信念不能。
第二,人们要“了解”这个命题。或者说,真命题必须在我们的视野之中。存在许多我们并不知道的真命题,它们不能构成我们(人类)的知识。我们常说知识如大海一样,我们知道的只是知识海洋中的一滴水。
第三,人们要相信他所知道的事实。如果某人不相信某些事实,尽管他了解,该事实不构成他的知识。哥白尼提出地球围绕太阳转的日心说观点,那时许多人了解这个事实,但并不相信,“日心说”不能构成他们的知识。
逻辑学家建立了认知逻辑,用之刻画人们对命题的认知态度如知道、相信等。知道逻辑是其中的一种。我们用K(a;p)表示某人a知道命题p,或者说p是a的知识。知道逻辑有如下的特征公理:
K:K(a; p→q) K(a;p)→K(a;q);
T:K(a;p) →p
D:~K(a,p~P)。
4:K(a,p)→K(a,K(a,p))
E:~K(a,p)→K(a,~K(a,p))
这些知识公理是什么意思?
公理K表示的是,如果认知主体a知道p→q,并且知道p,那么他知道q。
公理T表示的是,如果主体a知道p,那么p是真的。为了将知道的东西与纯粹信念区分开来,我们假定了人们知道的东西为真,而人们的信念不必为真。
D公理表示的是,人们不知道相互矛盾的事情。即相互矛盾的事情不能构成人们的知识。该公理的另外一个形式是:K(a;p) →~K(a,~p)。若p是一个主体的知识,那么~p将不是他的知识。
公理4表示的是,如果a知道p,那么他知道他知道p。该公理又称为“正的反省公理”。我知道“”,我知道“我知道‘地球围绕太阳转’”。由该公理,我们发现,只要主体知道一个为真的事实,那么他就知道无数个为真的事实。
公理E意即:如果a不知道p,那么他知道他不知道p。该公理又称“负的反省公理”、“智慧公理”。人们对这个公理往往持有异议:不是每个人都能够像苏格拉底那样“知道自己无知”;通常是,人们既然对某个事实无知,他并不一定知道自己对该事实无知。 电子书 分享网站
公共知识与博弈(2)
公共知识是一个群体人们之间的对某个事实的知识;它尽管为最近发展起来的概念,但该概念可追溯到休谟。《人性论》是一本伟大的哲学著作,休谟在27岁时将该书写成并出版(1738年)。在该书中有了公共知识这个概念的萌芽。逻辑学家刘易斯()在1969年给出严格的定义,他认为公共知识就是每个人都知道,每个人知道每个人都知道……依此类推。1976年博弈论专家奥曼()将公共知识引入博弈理论的研究。
奥曼在《不一致的达成》(Agreeing to disagree,1976)中对公共知识的定义如下:如果1和2两个人都知道E事件,1知道2知道E事件,2知道1知道E事件,1知道2知道1知道E事件,依此类推,那么我们就称1和2对于E事件具有公共知识。
从这个定义中可知,公共知识涉及一群体的对某个事实“知道”的结构。8在日常生活中,许多事实是公共知识,如:“所有人均会死”、“所有鸟均能飞(鸵鸟除外)”,对于它们,所有人均知道(智力有障碍者及婴儿除外),并且所有人知道其他人知道,当然其他人也知道别人知道他知道……
公共知识是相对于某个群体的。有些知识只属于某个人,它当然不是公共知识。科学家知道是其他人所不知道的知识,这些知识能够成为该科学家群体的公共知识,若科学家将之公布于众,该知识便成为整个社会的公共知识。
对任何一个博弈来说,“参与人是理性的”是起码的公共知识要求。对于像囚徒困境这样的完全信息博弈,双方的不同策略下的支付也是公共知识;在曹操和诸葛亮之间华容道上的博弈中,双方各种策略组合下的支付也是公共知识。
在有些博弈中,各种策略下的支付不能成为公共知识。比如在商战中,相互竞争的各方不知道其他商家在各种产量下的赢利情况,此时,策略下的支付不是公共知识。
对于不完全信息博弈,存在许多情况,在每个情况下,知识分布的不同博弈结果不一样。这里本书不分析群体行动中知识的分布,只是说明,知识分布的不同影响博弈参与人的策略选择,因而影响到博弈结果的最终形成。
任