- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 FastText文本分类以及生成词向量
1、安装2、文本分类FasttextFasttextFasttext是FacebookFacebookFacebook开源的文本分类工具。最近工作上用到了这个包,感觉又快又好用,在这里简单的做一下记录,这里使用的PythonPythonPython的相关接口1、安装在linux下安装比较方便,直接使用pip进行安装pip install fasttext2...
2018-07-20 17:56:39 7680 6
原创 使用python提取中文数字和英文
因为训练word2vec模型,需要处理数据集发现其中有很多特殊符号,所以使用python3python3python3进行了数据预处理,去除了预料中的特殊符号,这里使用unicode加正则表示式来进行相关的匹配。import restring = "12345464我不是药神123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》"print(stri...
2018-07-05 14:12:38 15165 1
原创 Character-level Convolutional Networks for Text Classification论文笔记
1、introduce本篇主要讲的是基于字符级别的CNN模型,本篇博客简要的记录一下这篇论文的笔记。1、introduce首先,文本分类是一个自然语言处理的经典主题,到目前为止,几乎所有的文本分类的技术都是基于词的,通过其中简单的统计,一些有序词的组合通常表现的比较好。 另一方面,许多研究者发现卷积网络在从原始信息中提取信息非常有效,从计算机视觉到语音识别或者其他的应用。...
2018-07-04 16:07:16 900
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人