中科院自动化所张海峰副研究员讲授《博弈论基础》课程

wujiai

注：本课程来自国内外知名大学和研究机构强化学**领域研究人员联合推出的2020强化学**夏令营。夏令营以在线公开课的形式进行，课程内容包括严谨的数学推导、最新的研究成果和理论。相关课程视频在ZOOM和B站同步播出。中国科学院自动化研究所（公众号：）已获得课程导师授权，在不改变原意的情况下对课程摘要进行编辑整理。

本期内容为中国科学院自动化研究所副研究员张海峰主讲的《博弈论基础》课程。课程内容包括研究动机与标准形式博弈、扩展形式博弈与不完全信息、贝叶斯博弈与不完全信息、纳什均衡及其变体、纳什均衡理论结果、重复博弈及其学**方法、其他解与演化博弈论等7个章节。

张海峰

中国科学院自动化研究所副研究员、硕士生导师

观看课程

提前剧透，文末有课程总结！

DVD

课程大纲

研究动机和标准博弈章节阐述了博弈论在强化学**中的必要性和地位。从生活中的游戏和博弈论的发展历史来介绍子博弈精炼纳什均衡，阐明了游戏中的基本要素和前提条件，并通过实例直观地解释了一般规则。正式博弈，解释纯策略和混合策略的概念。

02&03

扩展型博弈和不完全信息、贝叶斯博弈和不完全信息两章介绍了结合马尔可夫决策过程的马尔可夫博弈和不完全信息贝叶斯博弈，充分比较了扩展博弈和标准型博弈，解释了不完全信息和不完全信息的区别，总结了不同类型游戏的策略表征，展示了不同类型游戏的经典案例。

第四章：从博弈解推导出纳什均衡及其变体，介绍纳什均衡的含义，并解释帕累托最优与纳什均衡的区别。然后进一步介绍了混合策略的纳什均衡、扩展博弈的纳什均衡、子博弈细化纳什均衡、贝叶斯纳什均衡和完美贝叶斯纳什均衡。在章节的最后，张海峰副研究员总结了各类博弈对应的纳什均衡概念。

第五章纳什均衡理论结果介绍了纳什均衡的理论部分，包括证明纳什均衡存在性的纳什定理，并介绍了证明的基本不动点定理和引理。最后介绍了纳什均衡的计算复杂度和PPAD问题类别，以及学者们对这四个问题的约简。

第六章重复博弈与学**方法在重复博弈与学**方法中，在定义了重复博弈的概念后，介绍了重复囚徒困境问题中的经典策略“一报还一报”、“赢留”、“输”、“移”等策略。重复游戏。下面的匿名定理。在学**方法上，引入了虚拟对策（Play）和无悔学**（No-）。

第 7 章，替代方案和进化博弈论，介绍了另外两个均衡：均衡和均衡。还介绍了进化博弈论以及所涉及的模型和其他相关理论。

最后，张海峰副研究员用一张图总结了本课涉及的所有知识点，帮助同学们更加清晰地理解《博弈论基础》的课程脉络。

欢迎后台留言，推荐您感兴趣的话题、内容或信息！

中科院自动化所张海峰副研究员讲授《博弈论基础》课程

热门搜索

相关文章

中科院自动化所张海峰副研究员讲授《博弈论基础》课程

三级螺纹钢有哪些型号规格？怎么挑

三级螺纹钢和三级抗震的区别是什么

x四代土影黑土腿中间

废文网李鬼分站的安安静静备胎计划

一级二级三级螺纹钢用途有什么区别

2023年新电费收费标准？公布2023年