hadoop
yjl33
这个作者很懒,什么都没留下…
展开
-
Hadoop生态系统介绍
1、Hadoop生态系统概况Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。下图为hadoop的生态系统:2、HDFS(Hadoop分布式文件系统)源自于Google的GFS论文,发表于2003年10月,HDFS是G转载 2016-05-13 16:03:59 · 428 阅读 · 0 评论 -
大数据 hadoop2.6.0 高可用集群搭建(HA集群搭建)--亲测可用,入门必备
大数据 hadoop2.6.0 高可用集群搭建(HA集群搭建)hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA、YARN等。最新的hadoop-2.6.0又增加了YARN HA注意:apache提供的hadoop-2.6.0的安装包是在32位操作系统编译的,因为hadoop依赖一些C++的本地库,所以如果在64位的操作上安装hadoop-2.6.0就需要重新在64操作系统上重新编译(建议第一次安装用32位的系统,我将编译好的64位的也上传到群共享里了,如果有兴趣的可以自原创 2017-03-22 14:48:12 · 729 阅读 · 1 评论 -
Kafka配置参数详解
Kafka配置参数详解,kafka,大数据,hadoop,spark原创 2017-10-30 09:54:50 · 1037 阅读 · 0 评论