Hadoop学习(一）初识hadoop

最新推荐文章于 2022-03-09 11:45:52 发布

沼泽鱼97

最新推荐文章于 2022-03-09 11:45:52 发布

阅读量847

点赞数 2

文章标签： Hadoop

本文链接：https://blog.csdn.net/weixin_40535323/article/details/82024407

版权

前段时间读完了谷歌的三大论文，现在开始正式学习hadoop，今天就先整理一下hadoop的一些基本要点。

一.从起源开始聊起

hadoop的起源也就是谷歌著名的三大论文，或者可以说是谷歌三大论文的开源实现。Hadoop的核心组件有三个：HDFS，Hadoop MapReduce，HBase，分别是谷歌的GFS，Google MapReduce和BigTable的开源实现。

另外，有趣的是，Hadoop名字不是一个缩写，而是一个生造出来的词。是Hadoop之父Doug Cutting儿子毛绒玩具象命名的。

https://blog.csdn.net/zhongqi2513/article/details/80215748这篇文章为我们详细介绍了hadoop自2002诞生之初到现在的详细发展历史，有兴趣的读者可以了解一下。

二.Hadoop的概念

Hadoop在官方上的解释是：hadoop是一个分布式系统基础架构，由apache基金会开发，用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。

所以说，hadoop主要解决的是海量数据的储存和计算的问题。可以用于搭建大型数据仓库，PB级数据的存储,处理,分析,统计等业务。

hadoop可以分为狭义和广义两种：

1、狭义的Hadoop只是Hadoop本身 (HDFS＋MapReduce)。

2、广义的Hadoop指的是Hadoop生态系统，Hadoop生态系统是一个很庞大的概念，hadoop是其中最重要最基础的一个部分࿱

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

沼泽鱼97

关注关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Hadoop学习笔记（一）初识Hadoop

微信搜：import_bigdata，大数据领域硬核原创作者

04-04

703

前言研究生阶段将要接触大数据和深度学习的知识，在网上找的教程大多一上来就是一堆名词又解释不清楚，对新手相当不友好，在慕课网看到一个教程，利用博客记录下自己学习的过程。 hadoop介绍关于hadoop 最好的介绍莫过于官网的文档，hadoop的官网如下， http://hadoop.apache.org 我们一句一句来看看hadoop官网是怎么介绍的。 The Apache™ Hadoop® ...

大数据学习连载04篇：Hadoop概述（发展史、国内外应用、版本、Hadoop 3.0新特性）

黑马程序员官方博客

03-30

2154

本篇文章过长，大概4000+字数，全文干货无废话。分别给大家介绍一下Hadoop生态圈，并且Hadoop在国内国外互联网公司的应用场景和负责业务。后面也会给大家介绍Hadoop的各个发行版本和介绍。以及3.0版本的新特性是什么。附目录，望收藏随时观看。一、Hadoop概述 1.Hadoop介绍 Hadoop是Apache旗下的一个用java语言实现开源软件框架，是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。狭义上说，Hadoop.

参与评论您还未登录，请先登录后发表或查看评论

Hadoop基础知识总结

hitchenghengchao的博客

06-02

820

Hadoop（一）关于hadoop认识和理解

qiaobiao的博客

03-31

798

一、hadoop是什么？狭义上：hadoop是一个apache的一个顶级项目，一套开源软件平台广义上：hadoop是以hadoop为核心的整个大数据处理体系二、hadoop核心组件 1、Hadoop Common :支持其他Hadoop模块的常用工具 2、HDFS:hadoop分布式文件系统，提供对应用程序的高吞吐量访问 3、Hadoop Yarn:作业调度和集群资源管理框架 4、Hadoo...

Hadoop起源以及Google三篇论文介绍

hwm的专栏

08-29

1万+

什么是大数据？大数据核心的问题有： 1、海量数据如何存储？ 2、海量数据如何计算？大数据解决了以上两个问题。举两个例子： 1、大型电商网站的商品推荐，海量的历史的售卖数据如何存储？如何从海量的历史售卖数据中计算出盈利最大化的数据推荐给用户？ 2、天气预报，海量的天气数据如何存储？如何从海量的历史数据中计算预测出未来的天气？传统数据处理过程与大数...

Hadoop三大核心组件概述

一点见解

03-09

6950

HDFS（Hadoop Distribute File System）：hadoop的数据存储工具 NameNode： 1）负责客户端请求的响应 2）负责元数据（文件的名称、副本系数、Block存放的DN）的管理 DataNode： 1）存储用户的文件对应的数据块(Block) 2）要定期向NN发送心跳信息，汇报本身及其所有的block信息，健康状况 YARN（Yet Another Resource Negotiator,另一种资源协调者）：Hadoop 的资源管理器什么是YARN Apache

Hadoop阶段初识学习笔记

02-27

#### 一、Hadoop概述 Hadoop是一个开源的、可靠的、可扩展的系统架构，主要用于利用分布式架构存储海量数据并实现分布式的计算任务。它由Apache基金会维护，旨在解决大规模数据处理的问题。对于刚接触Hadoop的新手...

《Hadoop大数据开发实战》教学教案—01初识Hadoop.pdf

07-07

《Hadoop大数据开发实战》教学教案—01初识Hadoop的内容主要涵盖了大数据的基本概念、核心需求以及Hadoop框架的初步介绍。在这个章节中，学习者将了解到大数据在当今信息化社会中的重要地位，并掌握大数据的基本特征...

【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip

08-13

在IT领域，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分析。本资源"【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip"聚焦于Hadoop的基础知识，特别是对Hadoop进程的理解以及如何...

Hadoop生态系统介绍

woshiwanxin102213的专栏

02-22

5万+

1、Hadoop生态系统概况 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和Mapreduce，hadoop2.0还包括YARN。下图为hadoop的生态系统： 2、HDFS（Hadoop分布式文件系统）源自于Google的GFS论文，发表于2003年10月，HDFS是GFS克隆版。是Hadoo

Hadoop的一些基础知识整理

qq_48408655的博客

10-29

1616

♚Hadoop的认识 1.hadoop是google公司三篇论文思想的实现 ①hdfs—gfs ②mapreduce-mapreduce③hbase-bigtable 2.hadoop版本的演变经历三代，与一代相比二代最明显变化增加yarn 3.hadoop特点 ①高可靠性②高拓展性③高效性④高容错性 4.狭义的hadoop包括：hdfs、mapreduce、yarn 5.广义的hadoop是一个很庞大的体系，具有众多组件 6.hadoop的应用场景：①旅游行业②移动数据③电子商务④能源开发⑤节能⑥基础.

2021-06-04

qq_45703821的博客

06-04

1万+

这里写自定义目录标题Hadoop大数据基础单选多选判断问答Hadoop环境设置单选多选判断填空问答HDFS单选多选判断填空问答YARN单选多选判断问答MapReduce单选多选判断填空问答HBase单选判断填空问答Hive单选判断填空Pig单选判断填空问答Flume单选判断填空问答Sqoop单选判断Zookeeper单选多选判断填空问答Ambari单选填空问答Mahout判断问答 Hadoop大数据基础单选 Hadoop作者是（） A. Martin Fowler B. Kent Beck C.

Hadoop四大组件介绍

CSDN19970806的博客

08-07

1万+

1.学习Hadoop之前需要的基础，javaSE（基础），EE(SSM)，Linux基础，因为90%的框架都是用java写的，Hadoop、hive、HBase、下面是Hadoop的有关介绍。 2.学习大数据里面最核心的就是Hadoop，我们知道什么是大数据。就是一个非常庞大的数据，计算机无法直接取读取以及分析处理，这个时候就要用到我们学到的大数据。 Hadoop的四大组件： ...

Hadoop 入门教程（超详细）

热门推荐

西门催学不吹雪

04-18

9万+

文章目录1. Hadoop 框架1.1 Hadoop 介绍1.1.1 Hadoop 是什么1.1.2 Hadoop 的发展历史1.1.3 Hadoop 三大发行版本1.1.4 Hadoop 的优势1.1.5 Hadoop 的组成 1. Hadoop 框架 1.1 Hadoop 介绍 1.1.1 Hadoop 是什么 Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构。主要...

看起来很长但还是有用的Spring学习笔记

weixin_34233856的博客

03-26

953

本文首发于泊浮目的专栏：https://segmentfault.com/blog... Spring致力于提供一种方法管理你的业务对象。在大量Java EE的应用中，随处可见Spring。今天我将简单的介绍一下Spring这个框架。本文适合读者：想学Spring的Java开发者刚用Spring不久的人 Why 为什么要使用S...

google三大论文

Murphyt的专栏

11-19

4839

Google三大论文之一：BigTable Bigtable是一个分布式的结构化数据存储系统，它被设计用来处理海量数据：通常是分布在数千台普通服务器上的PB级的数据。Google的很多项目使用Bigtable存储数据，包括Web索引、Google Earth、Google Finance。什么是BigTable？ Bigtable是一个分布式的结构化数据存储系统。设计目的是可靠的处理PB级

Hadoop是什么，Hadoop主要有哪几部分组成？

多智时代的博客

03-23

1万+

通俗来讲，Hadoop是由Apache软件基金会所开发出来的开放源代码分布式计算技术，是以Java语言开发，专门针对大量且结构复杂的大数据分析所设计，其目的不是为了瞬间反应、撷取和分析数据，而是通过分布式的数据处理模式，大量扫描数据文件以产生结果。其在效能与成本上均具有优势，再加上可通过横向扩充，易于应对容量增加的优点，因而备受瞩目。 Hadoop不需要使用商业服务器，在一般个人计算机上就能运转。...

给Hadoop初学者的一些建议

qq_36609946的博客

11-09

2067

零基础学习hadoop,没有想象的那么困难，也没有想象的那么容易。从一开始什么都不懂，到能够搭建集群，开发。整个过程，只要有Linux基础，虚拟机化和java基础，其实hadoop并没有太大的困难。下面整理一下整个学习过程，给大家一个参考。首先我们要了解hadoop是什么？Hadoop能够做什么？Hadoop的使用场景是什么？Hadoop和大数据、云计算的关系是什么？如何使用hadoop？当大家对...

Hadoop入门：初识Hadoop与MapReduce

"这是一份关于hadoop的学习笔记，旨在帮助读者理解Hadoop的基础概念和架构原理，适合对云技术感兴趣的测试人员参考。笔记首先介绍了Hadoop作为开源分布式并行编程框架的角色，与Google的相关技术有密切关系。接着，...