数据增强_NLP 数据增强方法回译

最新推荐文章于 2023-03-22 15:53:07 发布

weixin_39725873

最新推荐文章于 2023-03-22 15:53:07 发布

阅读量795

点赞数

文章标签：数据增强

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39725873/article/details/111698011

版权

数据增强是扩充数据集的有效方法，本文介绍一种简单可行的 NLP 数据集扩充方法——回译，回译在文本分类中有比较好的效果，也被成功地用在 Kaggle 恶意评论分类比赛中。1. 回译上一篇文章《NLP 数据增强方法 EDA》介绍了一种 NLP 数据增强方法 EDA，本文介绍另一种简单的数据增强方法回译。回译指首先把句子翻译成另一种语言，然后再翻译回原来的语言。原始句子：对面的女孩看过来翻译成英文：...

摘要由CSDN通过智能技术生成

数据增强是扩充数据集的有效方法，本文介绍一种简单可行的 NLP 数据集扩充方法——回译，回译在文本分类中有比较好的效果，也被成功地用在 Kaggle 恶意评论分类比赛中。

1. 回译

上一篇文章《NLP 数据增强方法 EDA》介绍了一种 NLP 数据增强方法 EDA，本文介绍另一种简单的数据增强方法回译。回译指首先把句子翻译成另一种语言，然后再翻译回原来的语言。

原始句子：对面的女孩看过来

翻译成英文：The girl from the opposite looks over

回译：对面的女孩朝这边看了看

可以看到回译之后的句子和原始句子会存在不同，但是意思大体上一直。

2. 百度通用翻译 API

百度提供了通用翻译的 API，如下图所示。其中标准版是免费使用的，不限使用的字符量，但是每秒并发请求量是 1。通用翻译 API 地址：

http://api.fanyi.baidu.com/api/trans/product/prodinfo

百度通用翻译 API

最低0.47元/天解锁文章

weixin_39725873

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据增强_NLP 数据增强方法回译

数据增强是扩充数据集的有效方法，本文介绍一种简单可行的 NLP 数据集扩充方法——回译，回译在文本分类中有比较好的效果，也被成功地用在 Kaggle 恶意评论分类比赛中。1. 回译上一篇文章《NLP 数据增强方法 EDA》介绍了一种 NLP 数据增强方法 EDA，本文介绍另一种简单的数据增强方法回译。回译指首先把句子翻译成另一种语言，然后再翻译回原来的语言。原始句子：对面的女孩看过来翻译成英文：...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。