Hadoop环境配置(一)

Hadoopd HDFS伪分布式系统环境搭建

大数据的4v特征:
1.Volume:大数据量,90%的数据是近两年产生的。
2.Value:价值密度低,需要进行挖取获得数据价值
3.Velocity:增长速度快,数据的增长速度快,时效性高
4.Variety:数据多样化,数据种类和来源多样化:结构化数据,非结构化数据,半结构化数据

Hadoop
三大核心:
1.HDFS : 分布式存储系统
2.YARN : 资源管理调度系统负责管理和调度集群资源
3.MapReduce:分布式框架运算

四大特征:
1.扩容能力:有着可靠的存储和处理千兆字节数据
2.可靠性:Hadoop自动维护数据多份副本,失败的任务会自动重新部署计算任务。
3.成本低:通过普通机器组成服务器群来分发处理数据。
4.高效性:通过分发数据,Hadoop可以并行处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值