jieba
Mr愚先森
这个作者很懒,什么都没留下…
展开
-
jieba入门
1、三种分词模式 HMM是隐马尔可夫模型,默认是启用的jieba.lcut以及jieba.lcut_for_search直接返回 listimport jiebacontent = '小明是毕业于中国科学院的大学生'# 精确模式(试图将句子最精确地切开,适合文本分析)res2 = jieba.cut(content, cut_all=False, HMM=True)p...原创 2019-01-25 11:14:16 · 717 阅读 · 0 评论 -
jieba入门2
import jieba'''添加自定义词典1、载入词典: a、开发者可以指定自己自定义的词典,以便包含 jieba 词库里没有的词。虽然 jieba 有新词识别能力,但是自行添加新词可以保证更高的正确率 b、用法: jieba.load_userdict(file_name),file_name 为文件类对象或自定义词典的路径 c、词典格式和 dict.txt...原创 2019-02-18 17:04:03 · 210 阅读 · 0 评论