![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
HBase
51_big_data
热爱大数据、机器学习
展开
-
hive和hbase整合
hive和hbase同步https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration1、把hive中的lib下的hive-hbase-handler-1.2.1.jar cp到hbase/lib 下同时把hbase中的lib下的所有的jar,cp到hive/lib2、在hive的配置文件增加属性: hive-site....原创 2019-01-14 13:03:06 · 225 阅读 · 0 评论 -
HBase
Hbase简介Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式数据库利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务主要用来存储非结构化和半结构化的松散数据(列存 NoSQL 数据库)HBase 数据模型ROW KEY决定一行数据按照字典...原创 2019-01-10 11:26:05 · 115 阅读 · 0 评论 -
HBase性能优化方法总结
表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入HBase时,会按照region分区情况,在集群内做数据的负载均衡。有关预分...原创 2019-01-10 11:40:49 · 143 阅读 · 0 评论