jieba分词
三中分词模式
精确模式,试图将句子最精确地切开,适合文本分析
全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义
搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
安装
pip3 install jieba
分词
jieba.cut方法接受两个输入参数:
(1) 第一个参数为需要分词的字符串
(2)cut_all参数用来控制是否采用全模式
jieba.cut_for_search方法接受一个参数:需要分词的字符串,该方法适合.
原创
2021-05-18 19:53:54 ·
428 阅读 ·
0 评论