结巴分词
laoyaotask
Vue,PHP,Python,Office
展开
-
Python 结巴分词在使用过程中遇到的问题及对策
结巴分词是Python语言中效果最好的分词工具,其功能包括:分词、词性标注、关键词抽取、支持用户词表等。这几天一直在研究这个工具,在安装与使用过程中遇到一些问题,现在把自己的一些方法帖出来分享一下。官网地址:https://github.com/fxsjy/jieba1、安装。按照官网上的说法,有三种安装方式,第一种是全自动安装:easy_install jieba 或者 pi原创 2013-07-08 00:43:36 · 10104 阅读 · 3 评论 -
Python 中文分词工具 ——结巴分词的使用方法总结
结巴分词工具的安装及基本用法,昨天的博客中已经有所描述。今天要说的内容与实际应用更贴近——从文本中读取中文信息,利用结巴分词工具进行分词及词性标注。示例代码如下:#coding=utf-8import jiebaimport jieba.posseg as psegimport timet1=time.time()f=open("t_with_splitter.txt","r")原创 2013-07-08 21:38:09 · 13204 阅读 · 12 评论