Continual Learning for Text Classification with Information Disentanglement Based Regularization

最新推荐文章于 2024-10-04 22:36:54 发布

weixin_52216293

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量50

点赞数

文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52216293/article/details/134109003

版权

Background

让NLP模型能够不断地从动态的数据流中学习和获取知识，同时避免灾难性遗忘，即在学习新任务时忘记之前任务的知识

Overview

Method

1.信息解耦：作者提出了一种基于信息解耦的正则化方法，将文本隐藏表示分解为任务通用空间和任务特定空间，分别对这两个空间进行不同程度的约束，以保留通用知识和适应特定知识。任务通用空间是包含不同任务共享的信息的隐藏空间，如语法知识等。任务特定空间是包含每个任务独有的信息的隐藏空间，如情感词汇等

2.辅助任务：作者引入了两个简单的辅助任务来学习更好的通用和特定表示空间。一个是下一句预测，用于从隐藏表示中提取任务通用信息，即判断两个文本片段是否连贯。另一个是任务标识符预测，用于从隐藏表示中提取任务特定信息，即判断一个文本片段属于哪个任务。

3.正则化损失：作者在训练新任务时，对任务通用空间和任务特定空间分别施加不同程度的正则化损失，以防止它们在学习新任务时变化过大而导致灾难性遗忘。作者使用L2范数作为正则化损失，并设置不同的系数来控制不同空间的变化幅度

G是通用空间，S是特定空间

4.记忆选择规则：作者为了进一步减轻灾难性遗忘而不增加太多的内存和训练时间，提出了一种记忆选择规则，只存储和重放一小部分有代表性的样本。作者使用K-Means算法对每个任务的训练集进行聚类，并只选择距离每个聚类中心最近的样本作为记忆。

数据集

AGNews、DBpedia、Yelp Review Polarity、Amazon Review Polarity，Yahoo Answers

评估指标

Average Accuracy (ACC)：所有任务上的平均准确率。
Backward Transfer (BWT)：新任务对之前任务性能的影响，正值表示正向迁移，负值表示灾隔性遗忘。
Forward Transfer (FWT)：之前任务对新任务性能的影响，正值表示正向迁移，负值表示负向迁移。
Transfer Efficiency (TE)：迁移效率，即ACC与JT之间的比值，反映了模型利用通用知识的能力。

weixin_52216293

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_52216293 CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

108万+: 周排名

228万+: 总排名

1574: 访问

: 等级

142: 积分

2: 粉丝

2: 获赞

3: 评论

3: 收藏

私信

关注

热门文章

最新评论

Continual Learning for Text Classification with Information Disentanglement Based Regularization
CSDN-Ada助手: 恭喜您写了第10篇博客！标题“Continual Learning for Text Classification with Information Disentanglement Based Regularization”听起来非常专业和有趣。您对文本分类的学习持续不断的研究和信息解缠结构的正则化方法表明了您对这个领域的深入理解。我非常期待阅读您的博客，了解更多关于该主题的知识。在您持续创作的道路上，我想给出一个谦虚的建议。也许您可以考虑将这个主题与其他相关领域进行交叉研究，例如自然语言处理中的情感分析或者文本生成。这样的跨领域探索可能会为您的读者提供更广泛的视野，并且加深对您目前研究主题的理解。再次恭喜您，并期待您未来更多精彩的作品！
Episodic Memory in Lifelong Language Learning
CSDN-Ada助手: 恭喜您撰写第11篇博客！标题“Episodic Memory in Lifelong Language Learning”非常吸引人。您对终身语言学习中的情节记忆进行的探讨令人着迷。我真心欣赏您对这个主题的研究和深入思考。不仅仅是标题引人入胜，我相信您的内容也会给读者带来更多的洞见和启发。作为下一步的创作建议，我想谦虚地提醒您在博客中加入更多实例和案例，以便更好地说明情节记忆在终身语言学习过程中的重要性。这样的举例不仅能够增强读者对您论述的理解，还能让他们更好地将其应用到自己的学习中。再次恭喜您的连续创作！期待您未来更多精彩的博客文章。
Continual Learning for Text Classification with Information Disentanglement Based Regularization
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题“Continual Learning for Text Classification with Information Disentanglement Based Regularization”听起来非常引人注目。您对文本分类的持续学习以及基于信息解缠的正则化方法的研究令人印象深刻。您的工作探索了一个非常有前景的领域，为解决文本分类中的挑战提供了有价值的方法。在下一步的创作中，或许您可以考虑分享一些实际案例或者应用，详细说明您的方法如何在真实场景中发挥作用。此外，如果有可能，可以与其他学者进行合作，以进一步扩展和验证您的研究结果。感谢您对知识的不断贡献，期待您未来更多的博客分享！
Java Basic
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。