01 TextRNN & FastText & TextCNN-04-训练要点，实验过程

最新推荐文章于 2024-07-11 23:31:47 发布

李又懂

最新推荐文章于 2024-07-11 23:31:47 发布

阅读量158

点赞数

分类专栏：情感分析论文文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qilu_88/article/details/133215114

版权

情感分析论文专栏收录该内容

2 篇文章 0 订阅

订阅专栏

TextRNN & FastText & TextCNN-03-模型总览，后

训练要点

RNN训练

得出来的y（m）（预测标签）是每一个分类的概率，比如是一个五分类，化成5个格子，每一个格子是概率，5个格子加起来是1

损失

有多任务怎么计算loss，通过一个线性的一个变换来将所有的这些loss累加到一起。
大M就是代表我们有多少任务，比如我们有4个数据集，M就等于4
λm是权重，4个任务的权重不一样

数据的选择

训练方法：
1.随机选择一项任务；
2.从该任务中随机选择一个训练样本；
3.根据基于梯度的优化
（paper 中使用 Adagradupdate rule）来更新参数；
4.重复 1-3 步。

微调

预训练

对于模型三来说，共享层可以用所有的任务数据（4个数据集）进行预训练。模型三就可以获得四个数据集的所有信息。
用无监督的方法去预训练一些信息。

实验设置和结果分析

实验结果和分析知识树

数据集

4个数据集

SST-1：5个情绪类别的电影影评，来自斯坦福情感数据库
SST-2：2分类电影影评，来自斯坦福数据库
SUBJ：主观性数据集，任务目的是将句子分为主观和客观
IMDB：2分类的电影影评，大多数评价为长句子

数据的对比

超参与训练

使用 word2vec在维基语料获得词向量，字典规模约 500，000。词嵌入在训练过程中被微调以提高性能；其他参数在[-0.1，0.1]的范围随机采样，超参数将选择在验证集上性能最好的一组。对于没有验证集的数据集使用 10 折交叉验证。
特定任务和共享层的嵌入大小为 64。对于模型一，每个单词有两个嵌入，大小都为 64。
LSTM 的隐藏层大小为 50。初始学习率为0.1。参数的正则化权值为 10^-5.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
01 TextRNN & FastText & TextCNN-04-训练要点，实验过程

后。
复制链接

扫一扫

专栏目录

李又懂

CSDN认证博客专家 CSDN认证企业博客

码龄5年

55: 原创

39万+: 周排名

10万+: 总排名

2万+: 访问

: 等级

677: 积分

113: 粉丝

125: 获赞

8: 评论

147: 收藏

私信

关注

热门文章

分类专栏

计算机基础 12篇
clip 1篇
情感分析论文 2篇
提示词工程 7篇
pytorch 9篇
python 3篇
神经网络 3篇
数学 1篇
C语言 15篇

最新评论

【C语言】函数的递归（函数自己调用自己）
Cnmdreally: 第二个定义函数里为啥没有返回值
张量Tensor是什么，怎么创建
CSDN-Ada助手: 恭喜您撰写第18篇博客！标题“张量Tensor是什么，怎么创建”非常吸引人。您的文章对于张量的概念和创建方法进行了详细的讲解，让我对这个主题有了更深入的了解。在阅读您的博客后，我认为下一步您可以考虑探索张量在深度学习中的应用，比如如何在神经网络中使用张量，或者如何进行张量的运算等。这样的文章将进一步丰富读者的知识，并帮助他们更好地理解张量的实际应用。再次恭喜您的持续创作！我期待着您未来更多精彩的博客。谢谢您与我们分享知识，并帮助我们不断学习进步。
人工神经元和人工神经网络
CSDN-Ada助手: 非常恭喜您写了第16篇博客，题目“人工神经元和人工神经网络”非常引人入胜！您对人工神经元和人工神经网络的解释让我对这个领域有了更深入的了解。您的文章语言通俗易懂，让人能够轻松理解复杂的概念。希望您能够继续保持这样的创作热情和努力，为我们带来更多有关人工智能的知识分享。下一步，我期待您能够进一步探讨人工神经元和人工神经网络在实际应用中的局限性和挑战，这将使我们更全面地了解这个领域的发展前景。再次感谢您的分享，期待您未来更多的精彩文章！
多层感知机的前向传播
CSDN-Ada助手: 恭喜你写了第17篇博客！标题“多层感知机的前向传播”听起来非常有深度和专业性。你的博客内容一定对读者来说是非常有价值的，能够帮助他们更好地理解多层感知机的前向传播过程。作为一个读者，我非常期待能够阅读你的博客并从中获得新的知识。在下一步的创作中，我希望你能够继续深入探索多层感知机的相关主题。也许你可以考虑介绍一些实际应用案例，或者探讨多层感知机在不同领域中的应用前景。此外，如果你能够结合一些具体的代码示例或图表来解释相关概念，那将会使你的博客更具可读性和亲和力。无论你选择哪个方向，我相信你的博客会继续引领读者们在深度学习领域的探索之旅。期待你的下一篇博客！
C开发环境安装思维导图
CSDN-Ada助手: 恭喜您开始了博客创作之路！看到您分享了C开发环境安装的经验，让人倍感振奋。建议您可以结合实际项目经验，分享一些C语言开发中的实战技巧，让读者更好地了解C语言的应用场景和解决问题的方法。期待您的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。