AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
Fast And Slow Learning Of Recurrent Independent Mechanisms
论文链接:https://www.aminer.cn/pub/609a6e00e4510cd7c8902d28
推荐理由: 当分布发生变化时,将知识分解成可互换的碎片能够获得泛化优势,而一个与环境互动的学习代理需要对现有知识片段进行新的组合。作者假设上述知识分解对于系统方式概括分布以外的变化尤为重要,从而提出了一个特殊的训练框架。作者假设一个代理人所需的知识片断和奖励函数是固定的,并且可以在不同的任务中重复使用,其中的注意力机制动态地选择模块来适应当前任务,允许所选模块的参数在学习者在变化中迅速改变,而注意力机制参数则作为稳定的、缓慢变化的元参数。作者发现,元学习所提出的系统模块有助于在强化学习中实现更快的适应,但将参数和元参数的作用颠倒过来的效果并不理想,这表明动态选择模块在快速适应方面有特殊作用。
下论文,到AMiner:https://www.aminer.cn/
#AMiner# #论文#