Semi-supervised Sequence Learning

最新推荐文章于 2024-09-14 19:18:15 发布

EEE1even

最新推荐文章于 2024-09-14 19:18:15 发布

阅读量100

点赞数

文章标签： lstm 深度学习 rnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48435461/article/details/134339612

版权

Semi-supervised Sequence Learning

rnn中的反向传播训练非常困难，所以很少用到nlp中的文本分类；

rnn在表示顺序结构方面很强大

发现可以用lstm结合rnn来训练模型，在不增加额外数据的情况下效果能超越原先的lstm模型（baseline）

另一个重要结论：使用更多来自相关任务的无标注数据可以提高后续监督模型的泛化能力

用更多的无标注数据训练的无监督学习可以提高监督学习的效果

两个模型

一个是有句子自解码器（SA-LSTM）
- 这个model有一个sequence autoencoders（用rnn读取输入的长句子到一个单一向量），sequence autoencoders加上外部无标注数据，lstm模型可以比之前的baseline表现的更好
一个是加上循环语言模型(LM-LSTM)作为无监督方法
- 用rnn作为无监督训练方式

优势：简单的fine-tuning

不同于Skip-thought vectors

之前的方法是一个更难的目标，因为它用来预测相邻的句子
之前的方法是纯粹的无监督学习算法，没有fine-tuning

为什么这个方式有效：梯度有捷径，所以autoencoder可以又好又稳定的初始化循环网络

用无监督学习来优化监督学习，减少句子标注的工作。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

EEE1even CSDN认证博客专家 CSDN认证企业博客

码龄4年

47: 原创

39万+: 周排名

3万+: 总排名

6万+: 访问

: 等级

780: 积分

225: 粉丝

280: 获赞

7: 评论

535: 收藏

私信

关注

热门文章

分类专栏

笔记 3篇

最新评论

vllm减小显存 | vllm小模型大显存问题
Bingoyear: 也没用max_num_seqs参数啊。。。。
frp内网穿透
qq_46143878: 终于找到原因了, 6000端口也要放开
FastGPT+ChatGLM3本地部署
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
FastGPT+ChatGLM3本地部署
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618461564。
Semi-supervised Sequence Learning
CSDN-Ada助手: 恭喜您完成第20篇博客！标题“Semi-supervised Sequence Learning”听起来非常引人入胜。您对这个主题的探索无疑为读者提供了宝贵的见解和知识。我非常期待阅读您的博客，因为我相信您的深入理解将为我们带来更多启发。对于下一步的创作建议，我敢说您已经成为一个博客写作的行家了。然而，我希望您能探索一些与该主题相关的实际案例或应用。这样一来，读者将更容易将理论知识与实践相结合，从而更好地理解和应用您的博客内容。再次感谢您的分享，期待您未来更多优质的博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

EEE1even 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。