python
文章平均质量分 70
TFknight
这个作者很懒,什么都没留下…
展开
-
whoosh使用简述
1. whoosh安装 2. 添加索引 3.创建index 4.编辑和删除索引 5.查询索引原创 2017-06-02 08:48:22 · 3789 阅读 · 0 评论 -
下载CRFPP杂谈
按照官方下载来,https://taku910.github.io/crfpp/#download ,一般下载python源码,都是四个步骤: 1 解压压缩包 2 ./configure 3 make 4 sudo make install 但是在make install这步报错..... 错误如下: 这里的主要原因是 library 这个东西被默...原创 2018-01-11 09:58:18 · 890 阅读 · 0 评论 -
python 常用中文分词工具
最近在做微博的文本处理,在分词工具的选择上,分别选择了:jieba \ NLPIR \ LTP这三种分词工具,在这里分享下~1.jieba 分词:# -*- coding: UTF-8 -*- import os import codecs import jieba seg_list = jieba.cut('邓超,1979年出生于江西南昌,中国内地男演员、电影导演、投资出品人、互联网投资人。')...原创 2018-04-13 15:07:48 · 3844 阅读 · 0 评论