![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据增强
文章平均质量分 62
酷暑冷冰
这个作者很懒,什么都没留下…
展开
-
NER 数据增强
文章目录DAGA模型利用教师模型与知识蒸馏DAGA模型核心思想:标签线性化https://zhuanlan.zhihu.com/p/342032812利用教师模型与知识蒸馏https://mp.weixin.qq.com/s/OZlruC7zxIH9ZZlB7a4Q0gNER最好的模型需要大量的计算资源、时间与数据集,我们用一个网络结构小的模型,并且利用知识蒸馏,岂不是不用那么多时间了?NER最好的模型是较是模型,网络结构小的模型是学生模型。我们先利用业务内(可以看作特定的领域)的少量数原创 2021-03-15 16:36:22 · 798 阅读 · 4 评论 -
nlp数据增强总结
https://mp.weixin.qq.com/s/ZIQWpjrOHV6lii8WjymzBg原创 2021-05-08 15:59:56 · 445 阅读 · 0 评论 -
加入标点符号进行增强,仅适用于文本分类
在1到1/3的句子长度中,随机生成一个数字a。用a个标点符号在句子中随机插入。这些标点符号为:['.', ',', '!', '?', ';', ':']。理论基础:对于文本分类来说,EDA方法,如论是同义词替换,还是随机替换、随机插入、随机删除,都改变了原始文本的序列信息;而AEDA方法,只是插入标点符号,对于原始数据的序列信息修改不明显。代码:PUNCTUATIONS = ['.', ',', '!', '?', ';', ':']PUNC_RATIO = 0.3def insert_pu原创 2021-09-11 09:13:29 · 348 阅读 · 0 评论