算法
文章平均质量分 88
刀刀流
一只学生狗
展开
-
PageRank简单实现中的一个错误
PageRank简单实现中的一个错误在我的一篇博客PageRank中,在5.1 算法实现中简单实现部分原本是有一个错误的。这个错误也体现出我当时对PageRank算法有理解上的偏差。这是个什么样的错误呢?是这样的:简单实现中计算每个网页的PR值时使用的是最原始的方法,即下面的这个公式:PR(pi)=α∑pj∈MpiPR(pj)L(pj)+(1−α)N PR(p_{i}) = \alpha \sum原创 2016-08-15 22:00:03 · 3925 阅读 · 0 评论 -
MapReduce实现词频统计
问题描述:现在有n个文本文件,使用MapReduce的方法实现词频统计。附上统计词频的关键代码,首先是一个通用的MapReduce模块1:class MapReduce: __doc__ = '''提供map_reduce功能''' @staticmethod def map_reduce(i, mapper, reducer): """ map原创 2016-08-15 22:10:09 · 6535 阅读 · 0 评论 -
PageRank算法--从原理到实现
PageRank 算法标签: PageRank Markov MapReduce本文将介绍PageRank算法的相关内容,具体如下:PageRank 算法算法来源算法原理算法证明PR值计算方法1 幂迭代法2 特征值法3 代数法算法实现1 基于迭代法的简单实现2 MapReduce实现PageRank算法的缺点写在最后参考资料1. 算法来源这个要从搜索引擎的发展讲起。最早的搜原创 2016-08-15 21:40:46 · 52198 阅读 · 22 评论 -
HITS算法--从原理到实现
本文介绍HITS算法的相关内容。算法来源算法原理算法证明算法实现1 基于迭代法的简单实现2 MapReduce实现HITS算法的缺点写在最后参考资料1. 算法来源1999年,Jon Kleinberg 提出了HITS算法。作为几乎是与PageRank同一时期被提出的算法,HITS同样以更精确的搜索为目的,并到今天仍然是一个优秀的算法。HITS算法的全称是Hyperlink-Indu原创 2016-08-17 15:47:36 · 30670 阅读 · 5 评论 -
降维相关
降维相关降维相关什么是降维PCALDALLELE什么是降维一般来说,在ml里面,需要feature。而对于feature,我们又通常使用向量来表示。所以,简单地说,降维就是将一个高维的向量映射为一个低维的向量。形象地说,降维可以看作一个函数,输入是一个D为的向量,输出是一个M维的向量。那怎么样才算是一个好的降维结果呢?直观地说,就是要既能降低维度,又能使得损失的信息尽量少。举个例子,如果原创 2017-12-04 22:54:09 · 1416 阅读 · 0 评论