hbase ImportTsv的使用

ImportTsv的使用

ImportTsv 是一个将 TSV 格式的数据加载到 HBase 的工具类。它有两种不同的用法:1.通过 Puts 将 HDFS 中的 TSV 格式的数据加载到 HBase 中;2.通过生成StoreFile的方式使用completebulkload将数据加载到HBase中。

通过 Puts 将 HDFS 中的 TSV 格式的数据加载到 HBase 中

$ bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv '-Dimporttsv.separator=|' -Dimporttsv.columns=a,b,c <tablename> <hdfs-inputdir>
  • ‘-Dimporttsv.separator=|’ 指定列之间的分隔符
  • -Dimporttsv.columns 指定列族
  • tablename 指定hbase表名
  • hdfs-inputdir 指定数据文件在hdfs上的存放路径

通过生成StoreFile的方式使用completebulkload将数据加载到HBase中

1.生成StoreFile
$ bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv '-Dimporttsv.separator=|' -Dimporttsv.columns=a,b,c -Dimporttsv.bulk.output=hdfs://storefile-outputdir <tablename> <hdfs-data-inputdir>
  • ‘-Dimporttsv.separator=|’ 指定列之间的分隔符
  • -Dimporttsv.columns 指定列族
  • -Dimporttsv.bulk.output=hdfs://storefile-outputdir 指定StoreFile的生成路径
  • tablename 指定hbase表名
  • hdfs-data-inputdir 指定数据文件在hdfs上的存放路径
2.将生成的StoreFile通过completebulkload加载到hbase中
HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath` ${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/hbase-mapreduce-VERSION.jar completebulkload <hdfs://storefileoutput> <tablename>
  • hbase-mapreduce-VERSION.jar hbase对应version的jar包
  • hdfs://storefileoutput 生成StoreFile在hdfs上的路径
  • tablename hbase表名

注意:这里有第二种将StoreFile加载到hbase表中的方法

$ bin/hbase org.apache.hadoop.hbase.tool.LoadIncrementalHFiles <hdfs://storefileoutput> <tablename>
  • hdfs://storefileoutput 生成StoreFile在hdfs上的路径
  • tablename hbase表名
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值