Hadoop大数据工具介绍与环境配置

Hadoop是Apache开源的分布式系统基础架构,以其高可靠性、高效性和可扩展性降低数据分析成本。常见企业如Facebook和中国移动利用Hadoop进行数据存储和分析。在配置Hadoop前,需要确保安装了JDK。本文将指导如何选择和下载Hadoop版本,以3.3.6为例。
摘要由CSDN通过智能技术生成

Hadoop介绍

定位:Hadoop是Apache软件基金会旗下开源软件;
优点:免费 降低了数据分析的复杂性 支持多种应用(跨平台)
核心:HDFS+MapReduce
在这里插入图片描述

特点

高可靠性 :多台机器构成集群,部分机器发生故障,剩余机器可以继续对外提供服务。
高效性:集成上千机器一起计算。
可扩展性 :可不断往集群中增加机器。

在hadoop未出现之前高性能计算企业主要是一些小型机(性能强,成本大)而hadoop的出现实现了低性能机构成集群(降低了成本,增加旧机器的重复利用性)

应用现状

常用企业当中的数据架构

一、访问层:对企业的数据进行大量分析、数据实时查询、数据挖掘
二、大数据层(Hadoop):
离线分析:
Hive:用于存储和处理大规模数据。它提供了类似SQL的查询语言(HiveQL)以便于分析和查询数据。
详见大佬编写文档
Pig:Pig包括用来描述数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值