大数据学习

一:大数据软件框架结构概括
1.Hadoop
a.hadoop内核
b.mapreduce:为大数据提供计算(批处理计算框架)
c.hdfs:分布式文件系统,为大数据提供存储。
d.Hadoop yarn:集群资源管理器,负责集群的资源管理
e.HBase:nosql数据库
f.数据仓库工具Hive
g.pig工作流语言
h.机器学习算法库mahout
i:zookeeper:是一个集中式服务,主要负责分布式任务调度,用来完成配置管理,名字服务,提供分布式锁以及集群管理等工作(配置管理,名字服务,分布式锁,集群管理);
j:spark-内存计算框架(实时/内存/流式计算框架)
k:数据采集flume和kafka
1.1:flume数据采集系统,具有分布式,高可靠,高容错,易于定制和扩展的特 点
l:ambari:管理工具–可以快捷的监控,部署,管理hadoop集群,

二:大数据的数据采集和导入
数据平台整体架构:数据采集-存储-管理-处理-表现(可视化,报表及监控)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值