3天深入浅出NLP笔记（四）比赛思路进阶专题

最新推荐文章于 2021-12-21 12:00:00 发布

Laura_Wangzx

最新推荐文章于 2021-12-21 12:00:00 发布

阅读量176

点赞数 1

分类专栏： NLP自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37486501/article/details/114068230

版权

NLP自然语言处理专栏收录该内容

16 篇文章 4 订阅

订阅专栏

3天深入浅出NLP笔记（四）比赛思路进阶专题

模型调参
模型融合
预训练模型
特征工程
模型融合总结
作业

模型调参

在这里插入图片描述
参数初始化方法：

模型调参技巧：

数据打乱可以增加随机性。
BN用于图像；LN用于文本
对超过阈值的梯度值进行规约。
dropout对神经元的删除。防止过拟合
adam优化器。分类常用。
学习率偏小
激活函数
其他超参数，loss优化方式，只是在一点有效
全连接层

模型融合

交叉验证模型融合

先试试Bert系列（5个模型）
不同迭代次数的模型可以作为模型融合
半监督加入数据量的多少

预训练模型

五个预训练模型：

在这里插入图片描述

文本输入的截断策略：

文本长，采用截断策略，截断文本之后不用 / 之前不用 / 前+后。
在这里插入图片描述

五种预训练模型：

Bert-WWM更好，比Bert好。
在这里插入图片描述

Albert ：bert模型每层Attention参数多。Albert 可以用参数共享的方式

fine-tune：五种预训练模型结构：

Bert：字
在这里插入图片描述
Bert-WWM：词

AlBERT：
小版本的网络深度小，起始字符

Roberta：

XLNet：输出内容融合

特征工程

结合特征工程来做模型融合。

情感次出现的次数
将CNN模型的结果和Bert结果（基于词）进行融合。 ——推荐使用
没有预训练模型时，用Word2vec来。
不常用

模型融合总结

技巧部分——模型调参技巧：

数据打乱可以增加随机性。
BN用于图像；LN用于文本
对超过阈值的梯度值进行规约。
dropout对神经元的删除。防止过拟合
adam优化器。分类常用。
学习率偏小
激活函数
其他超参数，loss优化方式，只是在一点有效
全连接层
多模型融合（stacking）有效！！！：加入特征进行模型学习；基于预训练模型；Bert和NN Model融合。。。很多个模型投票；很多个模型stacking

作业

在这里插入图片描述

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
3天深入浅出NLP笔记（四）比赛思路进阶专题

3天深入浅出NLP笔记（四）比赛思路进阶专题模型调参模型融合预训练模型文本输入的截断策略：五种预训练模型：fine-tune：五种预训练模型结构：特征工程模型调参参数初始化方法：模型调参技巧：数据打乱可以增加随机性。BN用于图像；LN用于文本对超过阈值的梯度值进行规约。dropout对神经元的删除。防止过拟合adam优化器。分类常用。学习率偏小激活函数其他超参数，loss优化方式，只是在一点有效全连接层模型融合交叉验证模型融合先试试Bert系列（5个模型）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Laura_Wangzx 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。