Hadoop
文章平均质量分 79
沈波
本人小硕一枚,主要工作为利用机器学习、深度学习以及进化计算等手段,研究社交网络分析以及推荐系统的相关问题。
展开
-
Hadoop初窥
Hadoop初窥Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 随后在2003年Google发表了一篇技术学术论文谷歌文件系统(GFS)。GFS也就是google File System,google公司为了存转载 2015-03-27 21:28:36 · 646 阅读 · 0 评论 -
PageRank算法简介及Map-Reduce实现
PageRank算法简介及Map-Reduce实现转载自:http://blog.jobbole.com/71431/PageRank对网页排名的算法,曾是Google发家致富的法宝。以前虽然有实验过,但理解还是不透彻,这几天又看了一下,这里总结一下PageRank算法的基本原理。一、什么是pagerankPageRank的Page可是认为是网页,表示网页排名,转载 2015-03-30 17:25:56 · 765 阅读 · 0 评论