- 博客(2)
- 收藏
- 关注
原创 HBase 学习笔记
1.HBase是一个高可靠、高性能、面向列、可伸缩的构建在HDFS上的分布式数据库2.HBase通过行键、列族、列限定符、时间戳来确定一个单元格3.传统行式存储用于处理事务性操作,列式存储主要用于数据分析型业务4.一个HBase表会被分成多个Regin,同一个Regin不会被到多个Regin服务器中5.访问HBase的时候,先去HBase系统表查找定位这条记录属于哪个Regin,然
2017-01-17 08:51:55 453
原创 Hive 学习笔记
1. Hive是一个基于Hadoop的数据仓库工具,它提供了简单的SQL查询功能 2.支持批量插入,不支持单条插入 3.它是将简单的SQL语句转换成MapReduce程序来执行,创建的表可存放在hdfs或HBase上 4.hive倾向于用来分析数据,它只提供查询功能,不支持更新数据; 5.hive通过与jobtracker保持通信来初始化MapReduce任务,hive
2017-01-16 20:40:53 387
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人