:A是一个单人博弈,只有A在行动
wujiai
|通过纳什均衡方法,我们发现了三个纳什均衡,即左上上、右下上和右下下。 但只有一个(右下)满足反向推理的测试,另外两个都不是真实博弈树的解。
我们注意到上面的游戏树中似乎有一个特殊的部分。 即如果AB在前两轮选择上右,则本局将进入子局(下图红色)。 本子游戏为单人游戏,只有A演技。
这个游戏很容易理解。 很明显A会选择。 换句话说,如果这个游戏进行到第三步,也就是我们图中标记的子游戏,A应该采取以下策略。 而当我们回顾整体推导出来的三个纳什均衡(左上上、右下上、右下)时,我们发现只有右下策略告诉A在第三步中选择下一步。 剩下的两个策略告诉A选择第三步,所以剩下的两个策略是比较荒唐的。 因为我们知道策略需要告诉玩家在面对什么信息集时他想要做出什么选择。 因此,无论是整个博弈还是部分博弈,策略都应该是正确的,而不是像两个假纳什均衡(左上和右上)那样,指挥A在自己的子博弈中跳跃。 油锅。
因此,借助子博弈工具,我们找到了上一节留下的纳什均衡在序贯博弈中失败的原因。 因此,()是分析博弈的重要工具。 它的定义比较直观,就是游戏中的游戏。 就博弈树而言,只要从中取一点,然后从后面的树枝上折下来,这就是博弈树。 例如,当我们下围棋时,我们所走的每一步都是一个子棋。
关于子博弈,有三点需要说明:
首先是子博弈必须从单个节点开始,这样更容易理解。 例如,在上面的示例中,它从单个节点开始。
第二个是子博弈必须包含以此节点为根的子树上的所有分支和叶子,这样更容易理解。 你不能折断一根树枝并扔掉树枝上的几片叶子(通常没有人这样做)。
第三是子博弈不能破坏信息集。 这并不容易理解。 例如,如果整个游戏是这样划分的,那么红色部分就不能称为子游戏。 因为它破坏了信息集,所以如果一个博弈包含一个信息集,那么它必须包含该信息集中的所有节点。
那么我们总结一下,这里引入一个新概念。 首先,我们提到了不完全信息,这意味着在某个时刻,博弈双方都无法完全区分对方的决策。 在这种情况下,决策树上这些未解决的节点可以形成一个信息集。 策略的概念也更新了,从指导玩家做每个节点做的事情,到指导玩家做每个信息集做的事情。
然后我们讨论序贯博弈中纳什均衡和向后推理的等价性。 对于包含子博弈的博弈,如果一个博弈的纳什均衡是其中所有博弈的纳什均衡,则该纳什均衡称为子博弈完美纳什均衡(sub-game Nash子博弈精炼纳什均衡,SNE)。 SNE 必须是 NE,但对于游戏本身以及其中的任何子游戏来说它必须是 NE。
求解SNE和后向推理的结果是等价的。 也就是说,子博弈完美纳什均衡和后向推理是等价的,我们达到了将纳什均衡的分析工具引入序贯博弈的目的。








