短文本分类工具 TextGrocery

>>>  from  tgrocery  import  Grocery
# 新开张一个杂货铺,别忘了取名!
>>> grocery  Grocery( 'sample' )
# 训练文本可以用列表传入
>>> train_src  = [
     ( 'education' '名师指导托福语法技巧:名词的复数形式' ),
     ( 'education' '中国高考成绩海外认可 是“狼来了”吗?' ),
     ( 'sports' '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼' ),
     ( 'sports' '四川丹棱举行全国长距登山挑战赛 近万人参与' )
]
>>> grocery.train(train_src)
# 也可以用文件传入
>>> grocery.train( 'train_ch.txt' )
# 保存模型
>>> grocery.save()
# 加载模型(名字和保存的一样)
>>> new_grocery  = Grocery( 'sample' )
>>> new_grocery.load()
# 预测
>>> new_grocery.predict( '考生必读:新托福写作考试评分标准' )
education
# 测试
>>> test_src  = [
     ( 'education' '福建春季公务员考试报名18日截止 2月6日考试' ),
     ( 'sports' '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜' ),
]
>>> new_grocery.test(test_src)
# 准确率
0.5
# 同样可以用文本传入
>>> new_grocery.test( 'test_ch.txt' )
# 自定义分词器
>>> custom_grocery  = Grocery( 'custom' , custom_tokenize = list )

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值