NLP
自然语言处理
coco_1998_2
所有出自我手底下的东西,我自己收益最丰--侯俊杰
展开
-
Python jieba分词模块的基本用法
jieba(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结。安装jiebapip install jieba简单用法结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式,下面对这三种模式分别举例介绍:精确模式import jiebas = u'我想和女朋友一起去北京故宫博物院参观和闲逛。'cut = jieba.cut(s)...转载 2019-01-13 14:15:22 · 219 阅读 · 0 评论 -
TextRank
TextRank与PageRankTextRank的灵感来源于大名鼎鼎的PageRank算法,这是一个用作网页重要度排序的算法。这个算法是基于图的,每个网页可以看作是一个图中的结点,如果网页A能够跳转到网页B,那么则有一条A->B的有向边。这样,我们就可以构造出一个有向图了。然后,利用公式:经过多次迭代就可以获得每个网页对应的权重。下面是公式每个元素的含义:可以发现,...转载 2019-02-26 11:43:52 · 5437 阅读 · 0 评论