AMiner会议论文推荐第八十一期

Aminer是由清华大学研发的学术搜索平台,提供科技情报服务。推荐三篇ICLR2021的论文:1) '通过路由多样的分布感知专家进行长尾识别',旨在减少长尾分类器的偏差和方差;2) '关于主动学习中的统计偏差:如何以及何时修复它',提出新的纠正权重以消除主动学习的偏见;3) '稀疏量化频谱聚类法',介绍了一种结合进化算法和深度强化学习的新框架。这些工作展示了在AI领域的最新进展。
摘要由CSDN通过智能技术生成

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。


ICLR 2021 论文推荐

Long-tailed Recognition by Routing Diverse Distribution-Aware Experts(通过路由多样的分布感知专家进行长尾识别)

论文链接:https://www.aminer.cn/pub/5f7c4a7c91e0117ac2a78aca/?conf=iclr2021

推荐理由: 自然数据往往长尾分布在语义类别上,现有的识别方法倾向于关注尾部性能的提高,而以分类器方差增加带来的头部性能损失为代价。低尾部性能一般表现为较大的类间混淆和高分类器方差。作者的目标是通过RoutIng Diverse Experts(RIDE)来减少长尾分类器的偏差和方差,它由三个组成部分:1)一个用于多个分类器(专家)的共享架构;2)一个分布感知的多样性损失,鼓励对训练实例较少的类做出更多的决定;3)一个专家路由模块,动态地将更多的模糊实例分配给更多专家。作者表明RIDE是一个通用框架,能够应用于不同的骨干网络,并整合到各种长尾算法和训练机制中,以获得一致的性能提升。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

On Statistical Bias In Active Learning: How and When to Fix It(关于主动学习中的统计偏差:如何以及何时修复它)

论文链接:https://www.aminer.cn/pub/600830b19e795ed227f5306c/?conf=iclr2021

推荐理由: 当标记数据的成本很高时,主动学习是一个强大的工具,但它同时也引入了一个偏见,即训练数据不再遵循群体分布。作者将这种偏差形式化,研究了它在不同情况下的特点,并进一步介绍了新的纠正权重,以便在有益时消除偏见。通过上述方法,该工作不仅提供了一个可以改善主动学习方法的有效机制,而且还解释了忽略这种偏见的现有方法在经验上的成功之处。作者表明,当训练过度参数化的模型,如神经网络,有相对适度的数据集规模时,这种偏差会有积极的帮助作用。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning(稀疏量化频谱聚类法)

论文链接:https://www.aminer.cn/pub/600831829e795ed227f530bb/?conf=iclr2021

推荐理由: 近期研究提出将进化算法(Evolutionary Algorithms,EA)和深度强化学习(Deep Reinforcement Learning,DRL)结合起来,以合并两种解决方案的优点。然而,现有的混合方法仅成功应用于行为批评方法中,并呈现出显著的开销。作者通过引入一个新的混合框架来解决这些问题,该框架利用周期性遗传评估来软更新DRL代理的权重。基于此的方法适用于任何DRL方法,在最坏的情况下不会表现出有害的行为。在机器人应用和连续控制基准实验中表明,上述方法具有多功能性,明显优于先前的DRL、EA和混合方法。最后,作者采用正式的验证来确认策略的改进,缓解了DRL的低效探索和超参数敏感性。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

AMiner,AI赋能的学术搜索平台:https://www.aminer.cn/

#AMiner# #论文#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值