txt=open("水浒传.txt","r",encoding='utf-8').read()
words=jieba.lcut(txt)
counts={}#空字典,数数
for word in words:
if len(word)==1:
1.1、 精确模式
将句子最精确的切开,适合文本分析
默认使用jieba.lcut(文本),返回分词列表
jieba.cut 返回生成器,遍历生成器即可获得分词的结果
In: jieba.lcut('今天真是个好天气!')
Out: ['今天', '真是', '个', '好', '天气', '!']
st = '深圳市福田区华强职业技术学校'
In: jieba.lcut(st)
Out: ['深圳市', '福田区', '华强', '职业', '技术学校']
列表: