搜档网
当前位置:搜档网 › 博弈论基础作业及答案

博弈论基础作业及答案

博弈论基础作业及答案
博弈论基础作业及答案

博弈论基础作业

一、名词解释

纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡

贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识

见PPT

二、问答题

1.举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;

以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略

以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

3.当求职者向企业声明自己能力强时,企业未必相信。但如果求职者拿出自己的各种获奖证书时,却能在一定程度上传递自己能力强的信息。这是为什么?

由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。当然能力强的人也会声明自己的能力强。也就是说不同类型的求职者为了赢得职位会做出同样的声明。这样口头声明就不能有效的传递信息,因此企业不会轻易相信。而求职者拿出获奖证书就成了一个信号博弈。由于获得证书是要付出代价的,但代价却引人而异。能力强的个人可以相对轻易获得证书,而能力弱的个人却很难获得证书,以至于能力弱的人认为化巨大的代价获得证书,从而获得企业的职位是不划算的,因此干脆就不要获奖证书。因此获奖证书就成为个人能力的信号。

4.五个海盗抢得100颗钻石,他们为分赃发生了争议,最后达成协议,由抓阄确定出分赃顺序,然后按照民主程序进行分赃。首先由1号海盗提出分赃方案,五人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按1号提出的方案分赃,否则1号将被扔到海里喂鲨鱼。接着由2号提出方案, 四人共同举手表决。若赞成的占一半以上(不包括一半的情况),就按2号提出的方案分赃,否则2号将被扔到海里喂鲨鱼,依此类推。如果你是1号海盗,你该提什么样的方案?说明理由。

假设(1)五个强盗都很聪明,而且大家知道大家很聪明,大家知道大家知道大家很聪明,如此等等。

(2)每个海盗都很贪婪,希望获得尽可能多的钻石,但是又不想为了钻石丢掉性命。

(3)给定一个方案,只有该方案大于他的备选方案所获的钻石时,海盗才选择赞成。

第一个海盗的提议应该是:五个海盗分别获得的钻石数目为97,0,1,0,2,或者97,0,1,2,0。

具体理由自己思考,方法是倒推法。

三、计算题

1.试计算表1中的战略式博弈的重复剔除劣战略均衡。

表1 一个战略式表述博弈

B

A U M

D

对B 而言,战略M 严格劣于R ;(因为1<4, 1<6,0<8),因此剔除B 的战略M ;构成新的博弈如下

B

A U M

D

在新的博弈中,

对于A 而言,战略U 严格劣于D(因为1<3,2<7),因此剔除A 的战略U ,构成新的博弈如下:

B

A

M D

对于新的博弈中,已经没有严格的劣战略,因此没有严格的劣战略可以剔除。所以该博弈不是重复剔除严格劣战略可解的。

但是存在弱劣战略。对于B 而言,战略L 弱劣于R (因为6=6,1<8),因此剔除B 的弱劣战略L ,构成新的博弈如下:

B

A

M

D 在新的博弈中,对于A 而言,战略(因为2<7),因此剔除A 的战略M ,构成新的博弈如下:

B

A

D

因此,重复剔除(弱)劣战略均衡为(D ,R )

(ps: 如果同学们用划线的方法求纳什均衡,就可以发现纯战略nash 均衡有两个:(M,L )和(D,R )但采用剔除弱劣战略的方法,把其中一个纳什均衡剔除掉了)

2. 试给出下述战略式表述博弈的所有纳什均衡。

2

1

U

D 给定1选择U ,2给定1选择D ,2的最佳选择是L (因为4>2),在相应位置划线 给定2选择L ,1的最佳选择是D (理由自己写),在相应位置划线 给定2选择R ,1的最佳选择是U (理由自己写),在相应位置划线 找两个数字下都划线的,显然有两个纯战略纳什均衡:),(R U 和),(L D 据Wilson 的奇数定理,可能有一个混合战略均衡。 设1选U 的概率为θ,那么选D 的概率为θ-1 设2选L 的概率为γ,那么选R 的概率为γ-1,

如果存在混合战略,那么2选战略L 和R 的期望收益应该应该相等,因此应有)1(23)1(42θθθθ-+==-+=R L U U

?=θ 自己求解 (2分) 同样,1选战略U 和D 的期望收益应该应该相等

)1(14)1(32γγγγ-+==-+=D U U U

?=γ 得混合均衡:?

3.市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为P=16-Q 。其中P 是市场价格,Q 为市场总产量。

(1)求古诺(Cournot )均衡产量和利润。

(2)求斯坦克尔伯格(Stackelberg )均衡产量和利润。

(1)设两个企业的产量分别为1q ,2q ,有21q q Q +=,因此利润函数分别为:

21211121116)16(q q q q q q q --=--=π

212

22221216)16(q q q q q q q --=--=π

利润最大化的一阶条件分别为:

0216211

1

=--=??q q q π 0216122

2

=--=??q q q π 因此企业1和企业2的反应函数分别为:

2162

1q q -=

2

161

2q q -=

联立,得到?21==q q 。自己求解

(2)设企业1先行,企业2跟进。两个企业的产量分别为1q ,2q ,因此利润函数分别为:

21211121116)16(q q q q q q q --=--=π

21222221216)16(q q q q q q q --=--=π

由逆向归纳法,在第二阶段,企业2在已知企业1的产量的情况下,最优化自己的产量,从而得到企业2的反应函数:

0216122

2

=--=??q q q π 因此企业2的反应函数为:2

161

2q q -=

在第一阶段,企业1考虑到企业2的反应,从而自己的利润函数为:

)2

16(

1616)16(1

1211212111211q q q q q q q q q q q ---=--=--=π (2分) 要使企业1的利润最大,应满足一阶条件:

01

1

=??q π 得到?1=q 。

所以?2=q 。

(PS: 古诺模型是完全信息静态博弈,求的是纳什均衡;斯坦伯格模型是完全信息动态博弈,求的是子博弈精炼纳什均衡)

4.(1)试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。

(2)倘若2告诉1:2的战略是),,(j i c ,问此时1的最优战略是什么?(3)在(2)中,1和2的战略组合构成一个纳什均衡吗?均衡结果是什么?(4)(3)中的纳什均衡不是子博弈精炼的,原因是什么?

答: (1)

由逆向归纳法,子博弈精炼均衡为)],,(),,[(l e c g b ,均衡结果为(4,6)。 (2)若2的战略为),,(j i c ,则1的最优战略为),(f b 。

(3)给定2的战略为),,(j i c ,1的最优战略为),(f b ;反之,给定1的战略

),(f b ,战略),,(j i c 是2的一个最优战略。所以它们构成一个纳什均衡,均衡结

果为(6,3)。

(4)因为2的战略),,(j i c 中含有不可置信的威胁i ,使1在f 和g 之间不敢选g 。当博弈进行到2在l 与i 之间进行选择的时候,2必会选l ,给定如此,1选g 而不是f ,此时2会选e ,这就是子博弈精炼均衡。

5、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。

1 R

(1,2)

当“2”看见“1”未选R 时,设他认为“1”选L 的概率为P , “1”选L '的概率为1-P ,则“2”选l 的期望支付为:

P P P 31)1(14+=-?+

“2”选r 的期望支付为

P P P -=-+?2)1(21

当P P ->+231,即4

1

>

P 时,“2”选l ,而给定“2”选l ,“1”选L 收益为2,选L '的收益为3,选R 的收益为1,因此“1”会选L '。而给定“1”

选L ',“2”认为410<=P (注意:P 是“1”选L 的概率),与4

1

>P 矛盾。故

4

1

>P 不会有均衡;

当P P -≤+231,即41

≤P 时,“2”选r ,给定“2”选r ,“1”选L 收益

为0,选L '的收益为7,选R 的收益为1,因此“1”会选L '。而给定“1”选L ',

“2”认为0=P ,与41

≤P 吻合。于是,得到均衡战略:{}r P L ,0,=',即“1”

在第一阶段选择L ',“2”虽然看不到“1”的选择,但“2”认为“1”选择L 的概率为0,所以“2”在第二阶段选择r ,这样的战略构成了一个贝叶斯精炼

纳什均衡。均衡结果为(7,2)。

相关主题