贝叶斯纳什均衡与完美贝叶斯纳什均衡的关系是什么?
补充一下关于wPBE概念的引出,来自Games and Information, by Eric Rasmusen。
wPBE的引出承自Harasanyi的思路,从共同先验入手,先验信念确定了自然在博弈开始时选择参与人的类型的概率。拥有私人信息的参与者观察到了自然的行动,据此修正了自己的先验信念;其他参与者观察不到自然的行动,因而只能根据有私人信息的参与者的行动进行推断,并修正自己的信念。
参与人依据贝叶斯法则修正自己信念,而作出推断所依据的基础则是均衡策略所确定的行动,当其修正信念时假设其他参与人也会采取相应的均衡策略。但是不难看出,参与人的策略本身也依赖于自身的信念[1],因而仅采用策略定义均衡并不完整,还需要加上参与人的信念。
关于非均衡路径的信念问题。在均衡路径上,参与人可以根据先验概率和贝叶斯法则修正信念,但在非均衡路径上,由于 ,依照贝叶斯法则进行修正时,分母为0,后验概率没有定义,因而贝叶斯法则无法用于计算后验信念。
综上,可以给出一个比较自然的均衡定义:给定服从贝叶斯法则的均衡信念,均衡的策略组合由参与人的最优策略组成;非均衡路径上的信念服从某个特定的模式,这个模式与贝叶斯法则不相矛盾。
这里完美贝叶斯均衡应该指的是弱完美贝叶斯均衡(wPBE)?先按照这个吧...PBE是更强的一个概念,在和BE比较的时候wPBE和PBE好像是类似的,不过和SPNE比较的时候应该就不一样了
总的来说:wPBE一定是贝叶斯纳什均衡(BE),但是BE不一定是wPBE
先放直接的吧,之后有时间再详细补充其他背景/概念。
在MWG里面这个实际上是一个命题而非定义...不过我看也有教材那它当定义,再加上好理解一点所以就姑且用它了...简单说,一个BE要求每个参与人选择一个type-contingent strategy使得在给定其某一类型和他关于其对手策略的信念时, 他从中得到的期望支付至少和从其任一策略中得到的一样大。
注意,wPBE对非均衡路径上的信念没有要求,可以任意指定,但是处于均衡路径上的信息集上的信念必须与贝叶斯法则相一致。(实际上这里还可以继续加强,通过不同的思路得到PBE或者序贯均衡这两个不同的solution concept,不过有些情况下二者是等价的)
综合定义,个人理解wPBE是BE的一个拓展,有点类似将序贯理性原理应用于NE获得SPNE,在不完全信息博弈或者说更一般的extensive form game中,wPBE是通过引入【信念系统】对序贯理性原理进行拓展,在BE中嵌入一个认知模式(不知道该怎么描述...),使得由该模式生成的策略在均衡路径上是“一致”的,最终获得solution concept。
BE和wPBE之间的关系也给了一种寻找wPBE的方法:如果想要找到一个wPBE,可以首先找到博弈的BE,然后再逐个(可能存在不止一个BE)检验是否存在信念系统,使得其可以一起构成一个wPBE。
完美贝叶斯均衡必须满足下列四个要求:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每 个节点可能性的“判断”。
要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。⏺
要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略所 决定。
要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处 可能有的均衡策略所决定。