一 Hadoop 的介绍

本文介绍了Hadoop的基础知识,包括其三大发行版本Apache、Cloudera和Hortonworks的特点,以及Hadoop的优势。深入探讨了Hadoop的组成,如HDFS、YARN和MapReduce的架构概述,阐述了它们之间的关系。此外,还提到了Hadoop在大数据技术生态体系中的位置和一些相关技术,如Sqoop、Flume和Spark。
摘要由CSDN通过智能技术生成

1 Hadoop是什么

  1. Hadoop 是由Apatch基金会所开发的分布式系统基础架构.
  2. 主要解决的是:海量数据的存储和海量数据的分析计算问题.
    (大数据解决的问题是海量数据数据的采集,存储和计算)
  3. 广义上来说,Hadoop通常指一个更广泛的概念–Hadoop生态圈,如下图.
    在这里插入图片描述

2 Hadoop三大发行版本

Hadoop三大发行版本:Apache、Cloudera、Hortonworks。

Apache版本最原始(最基础)的版本,对于入门学习最好。
Cloudera内部集成了很多大数据框架。对应产品CDH。
Hortonworks文档较好。对应产品HDP。

1).Apache Hadoop
官网地址:http://hadoop.apache.org/releases.html
下载地址:https://archive.apache.org/dist/hadoop/common/
2).Cloudera Hadoop
官网地址:https://www.cloudera.com/downloads/cdh/5-10-0.html
下载地址:http://archive-primary.cloudera.com/cdh5/cdh/5/
(1)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值