import jieba
全模式
- 把句子中的所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义
seq_list=jieba.cut("我来到北京大学",cut_all=True)
print("full mode:","/".join(seq_list))
full mode: 我/来到/北京/北京大学/大学
精确模式
- 适合文本分析
seq_list=jieba.cut("我来到北京大学",cut_all=False)
print("full mode:","/".join(seq_list))
full mode: 我/来到/北京大学
默认模式
- 默认精确模式
seq_list=jieba.cut("我来到北京大学")
print("full mode:","/".join(seq_list))
full mode: 我/来到/北京大学
搜索引擎模式
- 在精确模式基础上对长词进行划分,适合于搜索引擎分词
seq_list=jieba.cut_for_search("我来到北京大学")
print(",".join(seq_list))
我,来到,北京,大学,北京大学