结巴分词jieba
- 结巴分词三种模式
精确模式: 试图将句子最精确切开
全模式: 所有可以成词的语句都扫描出来,速度快,不能解决歧义
搜索引擎模式:在精确模式的基础上对长词再次划分,提高召回率
jieba分词的三种模式的对比1
#jieba分词的三种模式的对比
import jieba
text='在精确模式的基础上对长词再次划分提高召回率'
text_list = jieba.cut(text,cut_all=True)
print('全模式:')
print('/'.join(text_list))
print('精确模式:')
text_list = jieba.cut(text,cut_all = False)
print('/'.join(text_list))
print('默认模式是精确模式