NLP竞赛tricks

最新推荐文章于 2022-09-19 14:31:06 发布

爱编程真是太好了

最新推荐文章于 2022-09-19 14:31:06 发布

阅读量1.3k

点赞数 2

分类专栏：深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012526436/article/details/100527803

版权

深度学习同时被 2 个专栏收录

44 篇文章 6 订阅

订阅专栏

自然语言处理

26 篇文章 8 订阅

订阅专栏

长期更新中，如果其中提到的技巧对您有帮助，请点个赞。

本文是对于我之前参加过的NLP比赛总结出来的一些经验，希望这些tricks能对大家有所帮助。

输入

1、字向量
2、词向量
3、位置编码，tm的相对位置编码或者w2v思路的位置编码
4、对于字向量与词向量如果要采用相加的形式组合在一起，可以把词向量重复n词，n表示的是当前词有多少个字

序列标注问题

1、采用BI0做数据标注
2、预测开始位置与结束位置
3、多实体的可将开始位置与结束位置的softmax替换为sigmoid，选择某个阈值x，大于x则选为开始位置或结束位置
4、采用star/end/none的标注方式，对每个token预测属于哪一类
5、对于1与4思路可采用特征提取器+crf的模式，对于2与3采用特征提取器+softmax/sigmoid的模式
6、对于有约束条件的序列问题，把约束与约束的位置信息编码，或者和约束有关系的trigger与trigger的位置信息编码，如果位置信息很重要，可以把trigger的位置信息和字的位置信息做cosine

文本分类

1、较为明显的fasttext
2、短文本textcnn
3、长文本HAN
4、通吃，精调的BiLSTM+Attention
5、终极方法Bert

常用特征提取器

1、预训练模型Bert、XLNet等
2、RNN+Attention
3、CNN+MAXPool
4、Dilate CNN + Gate CNN + Attention

模型融合

1、stacking，可能过拟合
2、融合多个模型的最优答案作为单个样本的最终预测结果。每个模型对某个样本的预测都可能存在错误，而有些错误是显而易见的，
而且存在固定的模式。因此在融合多个模型的多个主体的过程中，针对错误答案做了一定的过滤处理，过滤方式包括判断词性，判断是否是停止词。
3、对于每一条数据预测出来的实体，票数过半的作为输出候选项，随后从票数过半的实体中选出得分最高的前n个作为该句话的最终预测结果。这样既能保证偶然的错误预测不被选入，同时又能保证正确的多个答案能够尽可能多的输出。

爱编程真是太好了

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
NLP竞赛tricks

长期更新中，如果其中提到的技巧对您有帮助，请点个赞。本文是对于我之前参加过的NLP比赛总结出来的一些经验，希望这些tricks能对大家有所帮助。输入1、字向量2、词向量3、位置编码，tm的相对位置编码或者w2v思路的位置编码4、对于字向量与词向量如果要采用相加的形式组合在一起，可以把词向量重复n词，n表示的是当前词有多少个字序列标注问题1、采用BI0做数据标注2、预测开始位置与结...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。