NLP tricks 笔记本

nlp民工

已于 2022-10-27 14:32:57 修改

阅读量285

点赞数

文章标签： nlp

于 2022-10-27 01:25:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62990584/article/details/127544111

版权

持续更新……

1.给模型做对抗训练，参考链接，https://www.zhihu.com/question/407992050/answer/1380752786无论是给词ids做随机掩码，还是对embedding layer进行反向梯度扰动，在模型能力足够的情况下都能够有所提升，具体提升效果看数据质量。

2.先overfit，再寻找最优epoch，很多rnn模型在early stop的情况下可能效果不错，但是容易错过损失函数的最优点。

3.防止过拟合不只dropout或者设置惩罚项，把最后几层的输出拼接起来给最后的fc一起预测也是很好的手段。这个方法就是比较常见的ResNet，能够有效缓解神经网络退化的问题。

3.不计成本提高效果，可以将分类任务也做成十折交叉验证，训练十个模型来提高准确率。

4.损失函数还在下降，val的acc却上下起伏？可以在最后几个epoch都对test进行预测，再把预测结果做blending，亲证可以提高3%的准确率。

5.尽量去提升模型的深度而不是单层layer的广度，广而浅的神经网络性能远远比不上窄而深的神经网络性能。

6.序列上LN，非序列上BN（老生常谈了，但是有效果）。

7.bert的trick，把位置ids也训练成位置向量，加入embedding参与参数更新，至于段向量的训练按实际数据来决定。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
NLP tricks 笔记本

持续更新……1.给模型做对抗训练，参考链接，https://www.zhihu.com/question/407992050/answer/1380752786无论是给词ids做随机掩码，还是对embedding layer进行反向梯度扰动，在模型能力足够的情况下都能够有所提升，具体提升效果看数据质量。2.先overfit，再寻找最优epoch，很多rnn模型在early stop的情况下可能效果不错，但是容易错过损失函数的最优点。3.防止过拟合不只dropout或者设置惩罚项，把最后几层的输出
复制链接

扫一扫

nlp民工 CSDN认证博客专家 CSDN认证企业博客

码龄3年

2: 原创

162万+: 周排名

134万+: 总排名

1208: 访问

: 等级

23: 积分

2: 粉丝

1: 获赞

2: 评论

13: 收藏

私信

关注

热门文章

最新评论

Yolov7剪枝、量化
普通网友: 大佬好请问这个代码可以用于对yolov7-pose进行剪枝吗
Yolov7剪枝、量化
CSDN-Ada助手: 很棒的博客！看到你分享了关于Yolov7剪枝和量化的内容，让我对这方面的知识更加深入了解。建议可以在文章中加入一些实例或者案例来帮助读者更好地理解，同时也可以提到一些相关的深度学习框架和工具，比如TensorRT等。期待你更多的创作！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

Yolov7剪枝、量化

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。