html短文本,短文本分类工具 TextGrocery

授权协议: GPL

开发语言: Python

操作系统: Windows

软件介绍

TextGrocery 是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单。

示例代码:

>>> from tgrocery import Grocery

# 新开张一个杂货铺,别忘了取名!

>>> grocery = Grocery('sample')

# 训练文本可以用列表传入

>>> train_src = [

('education', '名师指导托福语法技巧:名词的复数形式'),

('education', '中国高考成绩海外认可 是“狼来了”吗?'),

('sports', '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼'),

('sports', '四川丹棱举行全国长距登山挑战赛 近万人参与')

]

>>> grocery.train(train_src)

# 也可以用文件传入

>>> grocery.train('train_ch.txt')

# 保存模型

>>> grocery.save()

# 加载模型(名字和保存的一样)

>>> new_grocery = Grocery('sample')

>>> new_grocery.load()

# 预测

>>> new_grocery.predict('考生必读:新托福写作考试评分标准')

education

# 测试

>>> test_src = [

('education', '福建春季公务员考试报名18日截止 2月6日考试'),

('sports', '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜'),

]

>>> new_grocery.test(test_src)

# 准确率

0.5

# 同样可以用文本传入

>>> new_grocery.test('test_ch.txt')

# 自定义分词器

>>> custom_grocery = Grocery('custom', custom_tokenize=list)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值