HBase导入TSV,CSV数据

HBase Import TSV

所谓 import tsv 就是固定格式的导入工具,导入格式以 \t 分割的文件

如果想要完成以上的功能, 则需要创建一张表, 用于接收数据

1. 创建表

create 'import_tsv','info','more'

2. 准备数据

1   xiaohei beijing 22
2   xiaolan shanghai    23
3   xiaolv  huoguoshan  99

3. 创建数据至hdfs

hdfs dfs -put hbase_import_tsv /testdata/

4. 查看示例,如何进行导入,

hadoop jar $HBASE_HOME/lib/hbase-server-1.1.2.jar

5. 选择importtsv ,继续查看下一步

hadoop jar $HBASE_HOME/lib/hbase-server-1.1.2.jar importtsv

6. 然后按照指定格式进行书写

Dimporttsv.columns=rowkey,列族:列名,列族:列名...... 分别对应输入数据按照 \t 分割的数据

hadoop jar $HBASE_HOME/lib/hbase-server-1.1.2.jar importtsv  -Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age import_tsv /testdata/hbase_import_tsv
 

7. 等待MR任务运行完成, 查看表数据

# 实际生产环境,对表进行扫描要注意 加一些条件,这里数据少直接查看结果
scan 'import_tsv'

HBase Import CSV

csv的格式就是按照逗号来进行分割的 , 与TSV的方式一样, 在最后一步进行导入时, 多了一个参数 -Dimporttsv.separator=,

1. 创建一张表, 用于接收csv格式的数据

create 'import_csv','info','more'
2. 准备测试数据
1,xiaohei,beijing,22
2,xiaolan,shanghai,23
3,xiaolv,huoguoshan,99

3. 将测试数据上传至HDFS

hdfs dfs -put hbase_import_csv /testdata/

4. 导入

hadoop jar $HBASE_HOME/lib/hbase-server-1.1.2.jar importtsv -Dimporttsv.separator=, -Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age import_csv /testdata/hbase_import_csv

5. 查看结果

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值