BAAI 2020 北京智源大会 | 戴彧虹 | Optimality Conditions for Constrained Minimax Optimization

回放地址

戴彧虹-Optimality Conditions for Constrained Minimax Optimization

报告内容

概述

本次Talk是BAAI 2020 北京智源大会 人工智能的数理基础论坛的一场报告,戴彧虹研究员(中科院数学与系统科学研究院研究员,智源学者)在本次报告中围绕 1,Background for Minimax Optimization 2,Differential of the Value Function 3,Optimality Conditions 三个方面来介绍了自己的工作,一种基于向心加速度(centripetal acceleration)的新的优化算法Simultaneous Centripetal Acceleration(SCA) method。

Part Ⅰ Background for Minimax Optimization

首先戴回顾了Minimax Problem,这个问题起源于多个领域,比如数学,生物,社会科学和经济学,并且因为它的丰富的数学结构(rich mathematical structure),已经在零和博弈(zero-sum games)领域研究了数十年。
在过去的几年中,minimax optimization在机器学习领域发挥了巨大的作用,比如:

  • Generative Adversarial Networks(GANs)
  • Adversarial Training
  • Multi-agent Reinforcement Learning

其中解决这些问题最经典的方法莫过于gradient descent ascent(GDA),但同时GDA也有一些缺点,这引出了GDA的很多变种,比较常用的有:

  • Consensus Optimization
  • Symplectic Gradient Adjustment(SGA)

接着戴提出了他们提出的GDA变种的新方法:

基于一个简单的直觉,一个物体绕着一个标准圆运动的向心加速度的方向总是指向圆心,提出了Simultaneous Centripetal Acceleration(SCA) method

这个方法和Consensus Optimization方法很像,优点是不需要计算Jacobi 矩阵(雅可比矩阵)。

接着戴给出了一些optimality的理论定义。
Nash equilibrium 以及条件相对宽松的 local Nash equilibrium。同时也分析了它们的缺点。

In fact , the Notion of Nash equilibrium does not reflect the order between the min-player and the max-player

这也导致(local) Nash equilibrium 并不适合大多数机器学习算法的minimax optimization。

然后戴又提到Stackelberg equilbrium,同时给出了global minimax point的定义,并指出

Unlike Nash equilibrium, a global minimax point always exists even if f is nonconvex-nonconcave,dute to the extreme-value theorem.

Jin,Netrapalli and Jordan提出了一种关于unconstrained minmax optimization的local minimax point的正确定义,并且戴又介绍了Contrained minimax problem,进一步引出了Motivation。

We shall extend this definition of local minimax point for the constrained minimax optimization problem (1) and provide both necessary optimality conditions and sufficient optimality conditions for the local minimax points of constrained minimax optimization problems.

Part Ⅱ Differential of the Value Function

戴在这一部分介绍了Parametric minimization problem以及Jacobian uniqueness conditions的定义:

  • Karush-Kuhn-Tucker point
  • linear independence constraint qualification
  • strict complementarity conditions
  • second-order sufficient optimality condition

之后又介绍了Derivatives of value function,同时将Jacobian uniqueness conditions的strict complementarity 的条件去掉,得到了Strong regularity of Karush-Kuhn-Tucker system

Part Ⅲ Optimality Conditions

太理论了,待补充~~

最后戴介绍了下一步的工作。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值