HBase数据的导入和预分区

HBase数据的导入和预分区

HBase数据导入

1.准备数据

创建文件data.csv

1,zhangmingyang,18
2,yunbaofeng,12
3,shirui,12
4,chenlinxue,30
5,wangren,34
6,fanxujuan,43
7,zhang,43
8,shirui,53
9,wangren,23
10,haoshiwei,12
11,mazong,14
12,laoyang,16

2.使用ImportTsv将csv文件直接导入HBase中

语法:

hbase <类名>-<分割>-<行键,列簇:列> <表名> <path>
步骤1:在Hbase中创建一张表ns1:in_table
create 'ns1:in01',{NAME=>'cf1',VERSIONS=>'3'}
hbase(main):003:0> create 'ns1:in01',{NAME=>'cf1',VERSIONS=>3}
0 row(s) in 2.6550 seconds

=> Hbase::Table - ns1:in01
步骤2:将data.csv导入到ns1:in01中

(1)当数据存放在linux本地文件系统中时,在shell中执行如下命令

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \
-Dimporttsv.separator="," \
-Dimporttsv.columns=HBASE_ROW_KEY,cf1:name,cf1:age ns1:in01 \
file:///root/hbase_test/data.csv

(2)当数据存放在HDFS文件系统中时,在shell中执行如下命令

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \
-Dimporttsv.separator="," \
-Dimporttsv.columns=HBASE_ROW_KEY,cf1:name,cf1:age ns1:in01 \
/hbase_test/data.csv

或者如下命令

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \
-Dimporttsv.separator="," \
-Dimporttsv.columns=HBASE_ROW_KEY,cf1:name,cf1:age ns1:in01 \
hdfs://hadoop02:9000/hbase_test/data.csv
步骤3:查看ns1:in01中的数据
hbase(main):004:0> scan 'ns1:in01'
ROW                                                           COLUMN+CELL     
 1                                                            column=cf1:age, timestamp=1562380331819, value=18                                                            
 1                                                            column=cf1:name, timestamp=1562380331819, value=zhangmingyang
 10                                                           column=cf1:age, timestamp=1562380331819, value=12                                                           
 10                                                           column=cf1:name, timestamp=1562380331819, value=haoshiwei                                                           
 11                                                           column=cf1:age, timestamp=1562380331819, value=14                                                         
 11                                                           column=cf1:name, timestamp=1562380331819, value=mazong                                          
 12                                                           column=cf1:age, timestamp=1562380331819, value=16                                                          
 12                                                           column=cf1:name, timestamp=1562380331819, value=laoyang                                                          
 
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值