CVPR/AAAI/ECCV顶会论文/代码

一,CVPR/AAAI/ECCV顶会论文/代码

本页面是自己学习时候,觉得有用的一些文章,暂时MARK一下,用得着的地方就再细看。目标检测、 图像分割、人脸识别、 目标跟踪、 三维点云、 图像处理、 图像分类、 姿态估计、 视频分析、 OCR
、GAN、小样本&零样本、 弱监督&无监督、神经网络、 模型压缩、NAS、 视觉常识

1.cvpr20200

1. 压缩方面

2. NAS方面

3. 目标检测
排行榜:目标检测排行榜

4. 人脸识别

  • Towards Universal Representation Learning for Deep Face Recognition
    论文地址:https://arxiv.org/abs/2002.11841
    论文分析:https://blog.csdn.net/m0_37400316/article/details/104900025
  • Suppressing Uncertainties for Large-Scale Facial Expression Recognition
    论文地址:https://arxiv.org/abs/2002.10392
    代码:https://github.com/kaiwang960112/Self-Cure-Network
  • Face X-ray for More General Face Forgery Detection
    论文地址:https://arxiv.org/pdf/1912.13458.pdf
  • 基于元学习的泛化人脸识别(CVPR2020 oral)
    Learning Meta Face Recognition in Unseen Domains
    论文地址https://arxiv.org/pdf/2003.07733.pdf

5. 无监督学习

6. OCR识别

7. 图像和谐化

8.迁移

  • Towards Discriminability and Diversity: Batch Nuclear-norm Maximization under Label Insufficient Situations(CVPR oral)
    论文地址:https://arxiv.org/abs/2003.12237
    代码地址:https://github.com/cuishuhao/BNM

9.视觉常识

10.Gradient 优化

Reference

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MADA (Multi-Agent Deep Deterministic Policy Gradient) 是一种多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)的方法,它在2018年的AAAI议上被提出。MADA主要关注的是解决MARL中的 Credit Assignment Problem(赋值问题),即如何正确地将奖励分配给每个智能体,以便它们能够独立学习和协作。 MADA的核心思想是利用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的一个扩展,它引入了代理到动作的加权归一化,这有助于减少环境中复杂交互导致的 credit assignment 不确定性。具体来说: 1. **经验回放**:MADA使用经验池来存储每个智能体的观察、动作和奖励数据,用于训练模型。 2. **代理动作归一化**:对于每个智能体,它的行为是基于其个体经验进行加权平均,这样可以确保即使在复杂的交互中,每个智能体的行为仍然可以独立解释。 3. **加权策略更新**:在策略网络更新时,考虑了其他智能体的当前行为,这样能更好地协调各个智能体的动作。 4. **协同训练**:MADA通常采用协同学习的方式,让所有智能体同时训练,以提高整体的团队性能。 要详细了解MADA的代码实现,你可以查看其原始论文《MADDPG: Cooperative Multi-Agent Deep Deterministic Policy Gradients》中的代码示例,这些通常在GitHub上发布。你可以在相关研究者或项目仓库中找到源代码,例如TensorFlow或PyTorch实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值