- 博客(4)
- 收藏
- 关注
原创 Flume学习总结
- Flume定义Flume是分布式,高可用,基于流式计算的,用于收集、聚合、移动大量日志数据的框架。- Flume优点可以和任何中央数据库集中式集成起到缓冲的作用,减轻存储设备的压力提供了数据流的路线事物基于channel,保证了数据的可靠性...
2018-05-30 23:12:08 12839
原创 Hbase学习总结
- Hbase定义它基于Hadoop之上的、分布式的、面向列的开源数据库它就是用来存储数据查询,查询数据。海量数据的存储,海量数据的查询- Hbase体系架构图 RegionServer:它是管理Region的。Hbase里的数据是分区域的,每个区与叫做一个Region。...
2018-05-26 19:57:14 5598
原创 Hadoop学习总结
Hadoop体系结构分布式存储:HDFS - - NameNode: 1. 列表内容 2. - DataNode: 1. 列表内容 2. - Hadoop集成Snappy压缩(Hadoop为CDH版本)去该网站下载你对应hadoop的cdh版本 (http://archive.cloudera.com/cdh5/redha...
2018-05-21 20:17:44 7796
原创 Hive学习总结
Hive定义: 1.Hive是FaceBook开源的用于解决海量的结构化数据统计的一个工具 2.Hive是Hadoop的一个数据仓库,他可以把结构化的数据映射成一张表,并提供类SQL查询功能 3.适合离线查询 4.将SQL转换成MapReduce程序 5.hive就是一个客户端*注意* 不同部门用到的hi...
2018-05-20 23:19:45 9668
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人