- 博客(5)
- 收藏
- 关注
原创 文本分类(六):使用fastText对文本进行分类--小插曲
需要注意的问题: 1、linux mac 平台 2、标签中的下划线是两个!两个!两个!环境说明:python2.7、linux 自己打自己脸,目前官方的包只能在linux,mac环境下使用。误导大家了,对不起。 测试facebook开源的基于深度学习的对文本分类的fastText模型 fasttext python包的安装:pip install fasttext第一步获取分...
2016-10-28 21:44:27 51659 72
转载 git命令大全
git init # 初始化本地git仓库(创建新仓库)git config --global user.name "xxx" # 配置用户名git config --global user.email "[email protected]"
2016-10-13 18:02:44 482
原创 文本分类(三):文本转为词袋模型
在第二篇中,提到了如何爬取网易的新闻文章,如果感觉比较麻烦,可以直接使用网上现有的资源。 比如:搜狗新闻数据,清华新闻数据。个人感觉搜狗新闻数据比较杂乱,清华的新闻数据应该是经过了初步的清洗。附上清华新闻的下载地址:地址 分享一下停用词表 ,可以用来去掉对文本影响不大的词语。
2016-10-10 11:52:48 7677
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人