AdaGDA: Faster Adaptive Gradient Descent Ascent Methods for Minimax Optimization

这周汇报用的ppt,论文信息大多见ppt,这里只放一下不懂的地方,以后会了再来

论文基本信息

论文分析了AdaGDA 与 the-VR-AdaGDA 的收敛性

  Lemma2  

 证明:


不会的

1:

为什么要这样分情况

2:

3:

Lemma4  不会证明,回头会了再来

4:

这俩为什么等价的 

5:

86和64 红色怎么推过来的  还是期望这块不懂诶(应该是根据assumption1  注:q是β的批次的数量

 

 6:

红色高亮部分怎么得来的

7: 

一个控制理论的函数 


 

笔记:

(35)式的性质:

来 自: (14 封私信 / 80 条消息) 优化学习 - 收藏夹 - 知乎 (zhihu.com)

另证 (上面看不懂看这个


柯西期望

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值