hadoop
飘着的风
生活就像长跑
展开
-
hadoop在国内的应用,百度,阿里
Hadoop在淘宝和支付宝的应用从09年开始,用于对海量数据的离线处理,例如对日志的分析,也涉及内容部分,结构化数据等。使用Hadoop主要基于可扩展性的考虑,规模从当初的3-4百节点增长到今天单一集群3000节点以上,2-3个集群,支付宝的集群规模也达700台,使用Hbase,个人消费记录,key-value型。阿里对Hadoop的源码做了如下修改:改进Namenode单点问题增转载 2014-02-27 11:52:08 · 1112 阅读 · 0 评论 -
R语言为Hadoop注入统计血脉
目录 R语言介绍 Hadoop介绍 为什么要让Hadoop结合R语言? 如何让Hadoop结合R语言? R和Hadoop在实际中的案例1. R语言介绍起源R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发。R转载 2014-03-05 11:08:45 · 699 阅读 · 0 评论