博弈论在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学。目前,已经成为主流经济分析的主要工具,对寡头经济、信息经济学等经济理论的发展做出了重要贡献。
博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行为的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动,是指每个人要根据其他人的可能反应来决定自己的决策和行动。因此,每个人在进行策略性决策和采取策略性行动时要根据其他人的可能反应来决定自己的决策和行动。
那么在咱们经济学考研中对于博弈论是如何考查的呢?在初级经济学考试中对于博弈论考查相对比较简单,更加注重基础概念的掌握,主要涉及题型有名词解释、选择题,部分院校可能会涉及到简答题或者计算题的某疑问,比如西南财经大学就比较喜欢考查计算题。对于博弈论在高鸿业教材里面是作为单独的一章,但是同学们对于博弈论的学习可以有选择性的学习,主要需要大家掌握以下几点:
一、基本概念(名词解释)
1. 占优策略
在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他人采取什么样的策略,该参与人的最优策略都是唯一的,这样的策略称之为占优策略。如下表所示,通过对支付矩阵的分析如果A、B厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡。
广告博弈的支付矩阵(B在前,A在后):
表1.1 占优策略
厂商A
做广告不做广告
厂商B做广告10,515,0
不做广告6,810,2
2. 纳什均衡
并不是每一个博弈的各个参与人都有一个占优策略。通过对如下支付矩阵的分析可以看出,现在厂商A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,那么厂商A应该也做广告;但如果厂商B不做广告,那么厂商A不做广告又是最好的选择,这种均衡就是纳什均衡。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上任何参与人单独改变策略都不会得到好处,即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
广告博弈的支付矩阵:
表1.2 纳什均衡
厂商A
做广告不做广告
厂商B做广告10,511,0
不做广告6,812,9
对于博弈均衡的分析大家主要是掌握划线法,通过划线法找出纳什均衡。
二、囚徒困境分析(简答、计算)
囚徒困境博弈模型的假设条件是:甲乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对它们偷窃的证据掌握并不充分,他们每个人都被单独囚禁并单独审讯,双方无法互通信息。警方向这两个人交代的量刑原则是:如果一方坦白,一方不坦白,则坦白者从宽处理,判刑一年,不坦白者从重处理,判刑七年;如果两人都不坦白,则警方由于证据不足,只能对两个人各判刑两年;如果两个人都坦白,则每人各判刑五年。
表1.3 囚徒困境
囚徒困境乙
坦白不坦白
甲坦白-5,-5-1,-7
不坦白-7,-1-2,-2
通过分析可以得出,囚徒困境只有一个占优策略均衡(坦白,坦白)。但是如果两个人都选择不坦白,则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:个人理性和团体理性的冲突。
对于囚徒困境的考查主要是结合寡头市场考查,考查形式主要是简答题和计算题。对于这两种题型大家一定要掌握支付矩阵的构造以及通过支付矩阵找出纳什均衡。比如以下两道真题考查形式。
【真题再现】用“囚徒困境”模型说明为什么寡头市场的价格战难以避免。
【答案解析】
囚徒困境描述的是无法相互沟通的个人之间出于自身理性的考虑所进行的选择往往并不符合双方(或社会)整体利益的最大化这一两难处境,即个体理性和集体理性相矛盾的情形。
双寡头在同一市场上进行双寡头竞争。每家厂商的策略集是(降价、不降价)。因为是同质产品,任何一家降价,将获得全部消费者,另一方则收益降为零,将获得亏损。若两家厂商都降价,则每家厂商的收益将减少。即出现个体的理性选择不符合集体理性现象。
为方便分析,将厂商获得的支付设定为它的市场份额。假定双寡头市场上有两厂商A、B。若某厂商降价而对方不降价,它将获得100的支付,对方将获得50的支付;若它不降价而对方降价,它将获得-50的支付,对方获得100的支付;若都不降价,双方都将获得支付为0,保持以前的水平不变;若都降价,他们各自得-10。因此,支付矩阵为:
厂商A
降价不降价
厂商B降价(-10,-10)(100,-50)
不降价(-50,100)(0,0)
该博弈的纳什均衡解是组合(降价,降价)。
虽然双方都选择不降价的总支付比每一个都降价的要好很多,但由于A,B均从个人角度出发,不可能在(不降价,不降价)上达到均衡,陷入所谓的囚徒困境,最终结果是双方均选择降价。
因此,双寡头市场的价格战难以避免。
【真题再现】 某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍,市场需求函数为Q=200-P。
求:
(1)若两个厂商同时决定产量,产量分别是多少?
(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?
(3)用该案例解释囚徒困境。
【答案解析】
(1)两个厂商同时决定产量属于古诺模型,构造厂商1的利润函数为:
利润最大化满足:
即:
同理厂商2利润最大化时满足:
联立①②可得:
若两个厂商达成协议垄断市场,则厂商目标为最终总利润最大:
厂商1和厂商2的产量都为为45;利润为4050;
设两厂商达成协议的垄断市场为双方合作,利润为(4050,4050);
两厂商同时决定产量为都不合作,利润为(3600,3600);
厂商1合作,厂商2不合作时,Q1=45,Q2=60;
厂商1的利润为:
厂商2的利润为:
所以,厂商1合作,厂商2不合作时,利润为(3375,4500);
厂商1不合作,厂商2合作时,利润为(4500,3375);
厂商2
合作不合作
厂商1合作(4050,4050)(3375,4500)
不合作(4500,3375)(3600,3600)
根据划线法,可得厂商1,2的上策是(不合作,不合作)即(3600,3600),双方利润均低于(合作,合作)(4500,4500),显然属于“囚徒困境”。