- 博客(4)
- 收藏
- 关注
原创 零和博弈(Zero-Sum Games)与非零和博弈(Non-Zero-Sum Games)
零和博弈(Zero-Sum Games)与非零和博弈(Non-Zero-Sum Games)定义典型例子思考(个人观点)参考文献定义零和博弈在博弈收益(支付)结果上看,一方所部就是另一方所失。得失的总和为零,这种情况的博弈可称为零和博弈 (zero-sum games)。零和博弈是常和博弈(constant-sum game)的一种特殊情况。常和博弈是指所有博弈方的得益总和为非零的参数,包含正和博弈,负和博弈,零和博弈。非零和博弈非零和博弈与零和博弈相对。非零和博弈表示在不同策略组合下各
2021-09-02 15:30:43
10759
原创 CFR虚拟遗憾最小化算法基础
虚拟遗憾最小化算法(Counterfactual Regret Minimization)如果不能遍历计算机所有节点的遗憾值,那么可以采用虚拟遗憾最小化算法来进行模拟计算。在遗憾匹配中,玩家通过跟踪所有过去所玩游戏的遗憾值来指导将来的决策,从而使遗憾值逐步减小,当遗憾值为 0(即玩家对没采取任何一种动作都表示不遗憾)时,证明当前策略最优,达到博弈的纳什均衡。概念定义平均整体遗憾:玩家 i 进行 T 次游戏,在第 t 次游戏使用策略tσ ,则玩家 i在这 T 次游戏中的平均整体遗憾为:
2021-08-25 14:47:06
1237
原创 Linux运行python常用操作
Linus运行python常用操作1 Conda环境配置1.1 查看已有环境1.2 新建环境功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1 Conda环境配置1.1 查看已有环境// 环境列表> conda in
2020-08-10 16:38:50
537
原创 Tensorboard的简单编程与使用
Tensorboard的使用编写程序监听数据操作编写程序build summarycurrent_time = datetime.datetime.now().strftime("%Y%m%d-%H%M%S")log_dir = 'logs/' + current_timesummary_writer = tf.summary.create_file_writer(log_dir)fed scalar with summary_writer.as_default():
2020-08-10 16:37:35
185
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人