- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 HBase快速导入数据--BulkLoad
Apache HBase是一个分布式的、面向列的开源数据库,它可以让我们随机的、实时的访问大数据。但是怎样有效的将数据导入到HBase呢?HBase有多种导入数据的方法,最直接的方法就是在MapReduce作业中使用TableOutputFormat作为输出,或者使用标准的客户端API,但是这些都不非常有效的方法。 Bulkload利用MapReduce作业输出HBase内部数据格式的表数据,然后
2015-08-05 13:38:59 13876 7
原创 HBase Split
HBase表的结构如下: 每个Table由若干个Region组成,每个Region由若干个Store组成(每个列组构成一个Store),每个由一个MemStore和若干个StoreFiles(HFiles)组成,每个StoreFile由若干个Blocks组成。HBase对表进行split有三种方式:Pre-splitting,Auto splitting,Forced Splits。Pre-s
2015-08-04 11:39:13 7365
算法的python实现代码、测试数据集及结果
2014-10-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人