![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据增强
文章平均质量分 89
jionlp数据分析
JioNLP 开源软件作者,数据分析专家
展开
-
JioNLP:预处理、信息抽取、数据增强、NLP简单功能与词典,找它就对了!
JioNLP安装方式 pip install jionlp在线试用网站 www.jionlp.com来看看 JioNLP 能干什么?功能主要包括:文本清洗,去除HTML标签、异常字符、冗余字符,转换全角字母、数字、空格为半角,抽取及删除E-mail及域名、电话号码、QQ号、括号内容、身份证号、IP地址、URL超链接、货币金额与单位,解析身份证号信息、手机号码归属地、座机区号归属地,按行快速读写文件,(多功能)停用词过滤,(优化的)分句,地址解析,新闻地域识别,...原创 2020-10-30 16:35:06 · 8385 阅读 · 6 评论 -
NLP自然语言处理的文本数据增强——回译(内含python工具包)
回译自然语言处理过程经常面临缺乏数据,因此需要进行数据增强。其中,回译,即将中文翻译成外文,再翻译回中文的操作可以扩展数据集,是一种好办法。这里直接提供工具包NLP工具包-回译数据增强,可以直接调用实现回译增强,而且返回的数据非常丰富。NLP工具包-回译数据增强提供了多个大厂的公开免费翻译接口:包括百度、腾讯、谷歌、有道、讯飞 ,数据结果非常丰富;你可以自己到各个大厂的 api 官方页面申请appid 和 密钥,拿到属于自己的翻译资源;如果你可以获取到大厂的 多个 appid 和密钥,那么直接原创 2020-09-18 10:47:25 · 5326 阅读 · 2 评论