文本分类课件_文本数据增强：撬动深度少样本学习模型的性能

最新推荐文章于 2022-02-15 19:20:24 发布

weixin_39682897

最新推荐文章于 2022-02-15 19:20:24 发布

阅读量210

点赞数

文章标签：文本分类课件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39682897/article/details/111575987

版权

本人主要关注NLP与深度学习这个交叉领域，因此本文从NLP领域涉及的目标场景出发，介绍文本数据增强的概念、相关技术手段以及展望。

本文目录：

1.文本数据增强理论介绍

1.1数据增强是什么

1.2 数据增强的应用场景

2.典型技术方案

2.1 通用EDA

2.2 基于TF-IDF的非核心词替换

2.3 回译

2.4 上下文文本生成

3.总结与展望

1.文本数据增强理论介绍

1.1 数据增强是什么

数据增强，是指对(有限)训练数据通过某种变换操作，从而生成新数据的过程。而文本数据增强则是针对文本数据进行操作。简而言之，就是利用数据增强这种手段扩大数据规模。

数据增强技术大体可分为以下两类：

• 句子层面增强：即在保持语义不变的情况下，变换文本的表达形式，例如回译、文本复述等手段；

• 词层面增强：即按照某种策略对文本局部进行调整，例如同义词替换、随机删除等。

1.2 数据增强的应用场景

(1)少样本学习场景

利用深度学习训练模型有时会遇到训练样本的数据量不能满足模型训练需求的情形，这就是少样本学习场景，这种场景较大概率会导致模型欠拟合。针对这种场景问题，研究学者和工程师自然而然想到了利用数据增强技术生成新样本进而扩充训练集，在有效降低人工成本的基础上促进模型性能的提升。近几年来也有许多研究验证了这种方法的有效性。

(2)半监督学习场景

从上一篇‘

最低0.47元/天解锁文章

weixin_39682897

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文本分类课件_文本数据增强：撬动深度少样本学习模型的性能

本人主要关注NLP与深度学习这个交叉领域，因此本文从NLP领域涉及的目标场景出发，介绍文本数据增强的概念、相关技术手段以及展望。本文目录：1.文本数据增强理论介绍1.1数据增强是什么1.2 数据增强的应用场景2.典型技术方案2.1 通用EDA2.2 基于TF-IDF的非核心词替换2.3 回译2.4 上下文文本生成3.总结与展望1.文本数据增强理论介绍1.1 数据增强是什么数据...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。