python中文分词的主要方法
python中文分词
一、jieba分词
1、精确模式(默认):试图将句子最精确地切开,适合文本分析;
seg = jieba.cut(“这是一段中文字符”, cut_all = False)
不加cut_all 为默认的精确模式
2、全模式,把句子中所有的可以成词的词语都扫描出来,但是不能解决歧义;
seg = jieba.cut(“这是一段中文字符”, cut_all = True)
...
原创
2019-05-05 16:09:49 ·
22328 阅读 ·
0 评论