AMiner会议论文推荐第八十期

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。


ICLR 2021 论文推荐

Information Laundering for Model Privacy(模型隐私的信息清洗)

论文链接:https://www.aminer.cn/pub/5f60963091e0113805870172/?conf=iclr2021

推荐理由: 在这项工作中,作者提出了信息清洗,一个加强模型隐私的新框架。与涉及保护原始数据信息的数据隐私不同,模型隐私的目的是保护一个已经学习过的模型,该模型将被部署到实际工程中使用。私有模型可以从一般的学习方法中获得,其部署意味着它将对给定的输入查询返回一个确定的或随机的响应。一个信息保密的模型通常由概率组件组成,它刻意操纵对模型的查询的预期输入和输出,因此模型的对抗性获取的可能性较小。在该框架下,作者开发了一个信息理论原则来量化模型效用和隐私泄漏之间的基本权衡,并得出最佳设计。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Skill Transfer via Partially Amortized Hierarchical Planning(通过部分摊销的分层规划进行技能转移)

论文链接:https://www.aminer.cn/pub/5fc4e66591e011abfa2fb14d/?conf=iclr2021

推荐理由: 为了快速解决复杂环境中的新任务,智能代理需要建立起可重复使用的知识。例如,一个学习过的世界模型捕获了适用于新任务的环境知识。同样地,技能捕捉了可以应用于新任务的一般行为。在本文中,作者研究如何将这两种方法整合到一个单一的强化学习代理中。具体来说,模型利用部分摊销的想法,在测试时间内进行快速适应。同时,行动由一个随时间学习的政策产生的,所依据的技能是通过在线规划来选择。作者在一系列具有挑战性的运动任务中证明了他们设计决策的优点,并证明了与竞争性基线相比,该方法在单一任务以及从一个任务转移到另一个任务中的采样效率有所提高。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Sparse Quantized Spectral Clustering(稀疏量化频谱聚类法)

论文链接:https://www.aminer.cn/pub/5f7c3b2991e0117ac2a78919/?conf=iclr2021

推荐理由: 给定一个大的数据矩阵,稀疏化、量化和/或执行其他条目式的非线性操作有诸多优点,例如,加快核心数值线性代数问题的迭代算法、提供非线性滤波器来设计最先进的神经网络模型等。作者利用随机矩阵理论的工具,对矩阵的特征谱在上述非线性变换下的变化做精确的说明。该工作表明,即使在急剧稀疏化/量化的情况下,信息特征结构的变化也很小,即在非常积极的稀疏化或量化的光谱聚类中,下游的性能损失很小。作者说明了这些结果如何取决于非线性,并描述了一个相变特征,当超过这个相变时,频谱聚类便成为可能,以及这种非线性变换何时会引入虚假的非信息性特征向量。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

AMiner,AI赋能的学术搜索平台:https://www.aminer.cn/

#AMiner# #论文#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值