NLP 之 jieba (结巴)制作词云
一 、jieba的导入
%pip install jieba
二、 jieba 结巴分词的几种模式及使用
-
精确模式
- 精确划分,视图将句子最精确地切分,适合文本分析
jieba.lcut(text,cul_all=False)
-
全局模式
-
全模式 把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义
jieba.lcut(text,cul_all=True)
-
-
搜索引擎模式
-
搜索引擎模式,是在精确划分的基础上,再进行全模式划分,,提高召唤率,适合用于搜索引擎分词。
-
jieba.lcut_for_search(text)
-
-
展示三种模式
text2 = '落霞与孤鹜齐飞,秋水共长天一色' print('精确搜索','/'.join(jieba.lcut(text2,cut_all=False))) print('全模式','/'.join(jieba.lcut(text2,cut_all=True))) print('搜索引擎模式'