大数据技术原理与应用笔记(2)——大数据处理架构Hadoop

本文详细介绍了Hadoop这一开源分布式计算平台,包括其简介、特性、生态系统和安装部署过程。Hadoop的核心是HDFS和MapReduce,具备高可靠性、高效性和可扩展性。在安装部分,涵盖了单机、伪分布式和分布式模式,以及各类型的Hadoop Shell区别。此外,还提到了NameNode、DataNode、JobTracker和TaskTracker等关键角色。
摘要由CSDN通过智能技术生成

大数据处理架构Hadoop

2.1 Hadoop简介

  • Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。
  • Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。
  • Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce。
  • Hadoop被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力。

2.2 Hadoop特性

Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性:

  • 高可靠性
  • 高效性
  • 高可扩展性
  • 高容错性
  • 成本低
  • 跨平台
  • 支持多种编程语言

2.3 Hadoop生态系统

Hadoop的项目结构不断丰富发展,已经形成一个丰富的Hadoop生态系统。
在这里插入图片描述

组件 功能
HDFS 分布式文件系统
MapReduce
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值