AMiner论文推荐——Fast And Slow Learning Of Recurrent Independent Mechanisms

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。


Fast And Slow Learning Of Recurrent Independent Mechanisms

论文链接:https://www.aminer.cn/pub/609a6e00e4510cd7c8902d28

推荐理由: 当分布发生变化时,将知识分解成可互换的碎片能够获得泛化优势,而一个与环境互动的学习代理需要对现有知识片段进行新的组合。作者假设上述知识分解对于系统方式概括分布以外的变化尤为重要,从而提出了一个特殊的训练框架。作者假设一个代理人所需的知识片断和奖励函数是固定的,并且可以在不同的任务中重复使用,其中的注意力机制动态地选择模块来适应当前任务,允许所选模块的参数在学习者在变化中迅速改变,而注意力机制参数则作为稳定的、缓慢变化的元参数。作者发现,元学习所提出的系统模块有助于在强化学习中实现更快的适应,但将参数和元参数的作用颠倒过来的效果并不理想,这表明动态选择模块在快速适应方面有特殊作用。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

下论文,到AMiner:https://www.aminer.cn/

#AMiner# #论文#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值