“LSTM之父”新作：一种新方法，迈向自我修正的神经网络

最新推荐文章于 2024-05-13 18:24:28 发布

数据实战派

最新推荐文章于 2024-05-13 18:24:28 发布

阅读量686

点赞数

分类专栏： AI 文章标签：神经网络 lstm 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shujushizhanpai/article/details/124980177

版权

神经网络的过程包括其权重矩阵(Weight Matrix：WM)的更新。

一旦网络训练结束，权重矩阵将被永久固定，然后根据网络在测试数据上的泛化结果评估其有效性。然而，许多环境在训练结束后会继续进化，测试数据可能会偏离训练，超出神经网络的泛化能力。

这就需要人工干预，来重新训练或调整模型。相反，一个完全自主的系统应该学会在没有干预的情况下，根据新的经验更新自己的程序。特别是在多任务学习（Multi-task learning）和元学习(Meta-learning，学习如何去学习)中，学习如何保持更新和微调模型是非常重要，这可以帮助网络快速适应各种情况和新挑战。

在A Modern Self-Referential Weight Matrix That Learns to Modify Itself这项研究中，“LSTM之父”Jürgen Schmidhuber等人根据更新和生成权重的现代技术，重新审视90年代以来提出的自我修正权重矩阵(self-referential WM)，特别是利用了Fast Weight Programmers（FWPs)背景下建立的机制，推导出一种新型的自我修正的权重矩阵(self-referential WM：SRWM)。

这项研究从以下三种方面对SRWM进行评估：

首先，该模型在标准的小样本学习上取得了具有竞争力的性能，证明了所提模型能够有效地产生有用的自我修正；

其次，通过将小样本学习设置扩展到连续多任务学习设置，测试了SRWM在运行时适应任务实时变化的能力；

最后，在ProcGen游戏环境设置的多任务强化学习（RL）环境中对其进行了评估，其中包括程序性生成的游戏环境。总的来说，证明了本文所提方法的实际适用性和强性能。

新型自我修正权重矩阵

本文提出的新型自我修正权重矩阵(SRWM)与最近提出的FWPs变体类似，通过学习自己发明的键/值的“训练”模式和学习速率进行自我训练，调用基于外积（outer products）和delta函数更新规则的基本编程指令。

具体步骤如下：

给定t时刻的输入x_t∈R^din，本文的SRWM W_t−1∈R^{(dout+2*din+1)×din}将会产生四个变量[y_t，q_t，k_t，β_t]。

其中，y_t∈R^dout是该层在当前时间步长的输出，q_t∈R^din和k_t

最低0.47元/天解锁文章

数据实战派

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
“LSTM之父”新作：一种新方法，迈向自我修正的神经网络

神经网络的过程包括其权重矩阵(Weight Matrix：WM)的更新。一旦网络训练结束，权重矩阵将被永久固定，然后根据网络在测试数据上的泛化结果评估其有效性。然而，许多环境在训练结束后会继续进化，测试数据可能会偏离训练，超出神经网络的泛化能力。这就需要人工干预，来重新训练或调整模型。相反，一个完全自主的系统应该学会在没有干预的情况下，根据新的经验更新自己的程序。特别是在多任务学习（Multi-task learning）和元学习(Meta-learning，学习如何去学习)中，学习如何保持更新和微调.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。