- 最近在学习文本分类相关内容,看到了有资料用TextGrocery来做,所以想上手试一试。因为我用惯了python3,所以想在python3上做,但是发现了很多问题。下面我们对这些问题进行解决。
温馨提示:如果你是python2,完全可以直接用2做,真的没有必要用3(哭了,本人强迫症吧可能*~*)。
确认安装好相应包
首先我们要知道这个包只能在Linux环境下运行,我在windows下试过,安装包时不但要下载c++编译器等等一系列东西,还有python3的兼容问题,问题更多,所以我选择在Linux下安装。
首先安装classifier
pip install classifier
然后安装tgrocery
pip install tgrocery
安装的步骤很简单,注意安装在你的python3路径下(用pip3安装,这里我的pip是软链接)。
改源文件
接下来我们就进入了漫长的改文件过程(准备好了么^ ~ ^),我们先用一个简单程序来测试安装成功与否,并改正:
# coding=utf8
from tgrocery import Grocery
grocery = Grocery('test')
train_src = [
('education', '名师指导托福语法技巧:名词的复数形式'),
('education', '中国高考成绩海外认可 是“狼来了”吗?'),
('sports', '法网孟菲尔斯苦战进16强 孟菲尔斯怒吼'),
('sports', '四川丹棱举行全国长距登山挑战赛 近万人参与')
]
grocery.train(train_src)
print(grocery.get_load_status()