- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 CDH impala hive hbase 整合
impala hive hbase 整合 最终达到的效果是这样的:hbase是数据的存储中心。impala、hive可以增查habse数据,不支持insert overwrite impala hive hbase的增删改在三者任何之一处操作,另两处均可以查到1、habse 创建表 create 'test_info', 'info' 表名test_info 列族: info 2
2016-07-29 14:08:30 1105
原创 Impala原理、使用
简介: impala属于Cloudera,基于内存的,可用户实时的交互式查询。Cloudera建议Impala集群内存最少128G,Impalad与DataNode运行在同一节点上原理简介: Impala与Hivemetastore database相集成,这两个组件之间可以共享database和table。如图所示,Impala主要由Impalad, State Store和CLI组成。Imp
2016-07-29 14:06:07 801
原创 Hbase迁移备份(后续更新)
Export、Import底层原理是MR,不适合太大量的数据迁移此为跨集群的数据导入,若非跨集群,修改hdfs地址即可导入导出: 目标表的特有数据不会覆盖掉,会保持特有数据的所有特征导出表数据导出表数据outputdir最好不存在 Export会自动创建命令:hbase org.apache.hadoop.hbase.mapreduce.Export <tablename> <outpu
2016-07-29 13:32:39 472
原创 Hbase常用命令
**一般操作:-----**hbase(main)> statushbase(main)> version创建命名空间: namespace指的是一个 表的逻辑分组 ,同一组中的表有类似的用途,相当于关系型数据库中的database。hbase(main):060:0> create_namespace 'test1'drop_namespace 创建该命名空间的表:hbase(main
2016-07-29 13:19:45 442
原创 Hbase原理详解
先上一张官方图片 首先指出图片的一个错误,Hlog应该属于HRegionserver的,不应该在HRegion中。1.图片解释: Client写入 -> 存入MemStore,一直到MemStore满 -> Flush成一个StoreFile,直至增长到一定阈值 -> 出发Compact合并操作 -> 多个StoreFile合并成一个StoreFile,同时进行版本合并和数据删除 -
2016-07-28 23:50:35 596
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人