环境说明:windows 7,python27,jieba VERSION 0.38,pycharm2016.1
1.简介:
支持中文分词,关键字提取,词性标注,自己管理词库等
2.安装:
方法一:开始->搜索cmd->cd到pip.exe目录->输入命令pip install jieba
3.代码片段:
import jieba
seg = jieba.cut('有关青春萌动',True/False)#分词,True/False 全模式/精确模式
seg = jieba.cut_for_search('有关青春萌动',True)#分词,搜索引擎模式
#seg 是迭代器,可通过list(seg)将其转换为列表
#关键词提取(import jieba.analyse)(sentence,关键词数目)
import jieba.analyse
seg = jieba.analyse.extract_tags('有关青春萌动',12)
print ' '.join(seg)
#词性标注
# import jieba.posseg as pseg
words = pseg.cut("我爱北京天安门")
for w in words:
print w.word,w.flag