Hadoop
文章平均质量分 77
zhouhong1026
这个作者很懒,什么都没留下…
展开
-
海量数据的二度人脉挖掘算法(Hadoop 实现)
原创博客,转载请注明:http://my.oschina.net/BreathL/blog/75112 最近做了一个项目,要求找出二度人脉的一些关系,就好似新浪微博的“你可能感兴趣的人” 中,间接关注推荐;简单描述:即你关注的人中有N个人同时都关注了 XXX 。 在程序的实现上,其实我们要找的是:若 User1 follow了10个人 {User3,User4转载 2012-09-02 14:57:14 · 1225 阅读 · 0 评论 -
Hadoop源码阅读之三个核心模块代码组织情况(一)
(一)Hadoop下三大核心项目说明:1.Common----Hadoop项目的core部分更名为Hadoop Common。Common为Hadoop的其他项目提供了一些常用的工具,主要包括系统配置工具Configuration、远程过程调用RPC、序列化机制和Hadoop抽象文件系统FileSystem等。它们在通用硬件上搭建云计算环境提供的基本的服务,并为之该平台上的软件开发提供了所需的原创 2014-02-24 16:54:31 · 4023 阅读 · 0 评论 -
Hadoop集群的安装
(一)配置环境1.1.硬件:三台机器:ubuntu12.04-64 server1.2 软件:jdk 1.6.0_45 64位hadoop-1.0.3 1.3 分工如下:node00:NameNode/JobTracker/SecondaryNameNode(这里最好用一台机来单独做SecondaryNameNode)node01:DataNode/TaskTrackernode转载 2014-03-06 19:09:04 · 1969 阅读 · 0 评论