人工智能博弈 博弈相关概念 纳什均衡:改变这个决策 也不能带来比之前更好的收益 遗憾最小化算法 v指的是已经产生了一个行动序列h 首先计算其他玩家在产生这一个行动序列h中的他们的概率值是多少✖在这个策略之下 从行动序列h进入到终结局势z的概率✖玩家i在终结局势z的概率 进行遍历然后累加 虚拟遗憾值r=在策略之下和信息集i的情况之下即将采取行动a带来的虚拟价值-在策略之下和信息集i的情况之下已经采取行动a带来的虚拟价值 虚拟遗憾最小化算法 人工智能安全