jieba(结巴)是一个强大的分词库,完美支持中文分词
三种分词模式
import jieba
s = u'我想和女朋友一起去北京故宫博物院参观和闲逛。'
cut = jieba.cut(s)
#三种模式
print( '【Output】精确模式:')
print (cut)
print ('/'.join(cut))
print( '【Output】全模式:')
print ('/'.join(jieba.cut(s,cut_all = True)))
print( '【Output】搜索引擎模式:')
print('/'.join(jieba.cut_for_search(s)))
结果
词性分析
import jieba
import jieba.posseg as psg
s = u'我想和女朋友一起去北京故宫博物院参观和闲逛。'
cut = jieba.cut(s)
print ('【Output】')
for x in psg.cut(s):
if (x.flag.startswith(