python
sunshine_9990
这个作者很懒,什么都没留下…
展开
-
Python的jieba分词及TF-IDF和TextRank 算法提取关键字
参考文章:Github上的项目———jieba中文分词对于NLP(自然语言处理)来说,分词是一步重要的工作,市面上也有各种分词库,11款开放中文分词系统比较。1.基于词典:基于字典、词库匹配的分词方法;(字符串匹配、机械分词法) 2.基于统计:基于词频度统计的分词方法; 3.基于规则:基于...转载 2018-11-29 18:34:19 · 2599 阅读 · 0 评论 -
jieba分词中用到的TF-IDF算法的介绍
注:利用jieba分词进行关键词抽取(选择TF-IDF算法)这里介绍基于TF-IDF算法的关键词抽取(干货|详解自然语言处理之TF-IDF模型和python实现), 只有关键词抽取并且进行词向量化之后,才好进行下一步的文本分析,可以说这一步是自然语言处理技术中文本处理最基础的一步。jieba分词中含有analyse模块,在进行关键词提取时可以使用下列代码 #练习使用scikit...原创 2018-11-29 19:27:35 · 6232 阅读 · 0 评论