HBase
51_big_data
热爱大数据、机器学习
展开
-
hive和hbase整合
hive和hbase同步 https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration 1、把hive中的lib下的hive-hbase-handler-1.2.1.jar cp到hbase/lib 下 同时把hbase中的lib下的所有的jar,cp到hive/lib 2、在hive的配置文件增加属性: hive-site....原创 2019-01-14 13:03:06 · 233 阅读 · 0 评论 -
HBase
Hbase简介 Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库 利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务 主要用来存储非结构化和半结构化的松散数据(列存 NoSQL 数据库) HBase 数据模型 ROW KEY 决定一行数据 按照字典...原创 2019-01-10 11:26:05 · 128 阅读 · 0 评论 -
HBase性能优化方法总结
表的设计 1.1 Pre-Creating Regions 默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入HBase时,会按照region分区情况,在集群内做数据的负载均衡。 有关预分...原创 2019-01-10 11:40:49 · 149 阅读 · 0 评论