文章目录
1 Hadoop是什么
- Hadoop 是由Apatch基金会所开发的分布式系统基础架构.
- 主要解决的是:海量数据的存储和海量数据的分析计算问题.
(大数据解决的问题是海量数据数据的采集,存储和计算) - 广义上来说,Hadoop通常指一个更广泛的概念–Hadoop生态圈,如下图.
2 Hadoop三大发行版本
Hadoop三大发行版本:Apache、Cloudera、Hortonworks。
Apache版本最原始(最基础)的版本,对于入门学习最好。
Cloudera内部集成了很多大数据框架。对应产品CDH。
Hortonworks文档较好。对应产品HDP。
1).Apache Hadoop
官网地址:http://hadoop.apache.org/releases.html
下载地址:https://archive.apache.org/dist/hadoop/common/
2).Cloudera Hadoop
官网地址:https://www.cloudera.com/downloads/cdh/5-10-0.html
下载地址:http://archive-primary.cloudera.com/cdh5/cdh/5/
(1)