hbase之bulkload

最新推荐文章于 2024-06-20 08:52:54 发布

cclovezbf

最新推荐文章于 2024-06-20 08:52:54 发布

阅读量319

点赞数

分类专栏： hbase 文章标签： hbase bulkload

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cclovezbf/article/details/116135258

版权

hbase 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

需求。如何把hdfs的数据转入hbase？ datax？spark？flink？

不不不，直接用hbase自带的命令即可。参考 http://hbase.apache.org/2.2/book.html

前提。hdfs存储格式为text

hbase数据为列族是0 列名是ou_code ou_level

1把数据放到hdfs上去。这个如果你的表存储格式为text直接用存储目录也行

二将文件转化为hfile

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,0:ou_code,0:ou_level -Dimporttsv.bulk.output=/user/devuser/warehouse/cc_test_load_hbase/output jl:test_load /user/devuser/warehouse/cc_test_load_hbase/input/test_load_hbase

说明

importtsv.columns 是hbase的rowkey 列族列名第一个默认是rowkey

output 不能存在否则报错

jl:test_load hbase名称空间jl和表明test_load 名称空间不能少

/user/devuser/warehouse/cc_test_load_hbase/input/test_load_hbase hdfs文件

注意！！！不要随便加空格0:ou_code ,0:ou_level例如这里有个空格他会把后面level 认为是另一个参数也就是名称空间。会报个名称空间非法错误

然后区分中英空格hbase org.apache.hadoop.hbase.mapreduce.ImportTsv 这里当时搞了个中文空格 linux 看又看不出来一直报命令没找到还是啥的。

会采用mr的形式将格式转化为hfile 到输出目录

加载数据到hbase

$ bin/hbase org.apache.hadoop.hbase.tool.LoadIncrementalHFiles <hdfs://storefileoutput> <tablename>

hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles /user/devuser/warehouse/cc_test_load_hbase/output jl:test_load

查询HBASE数据，发现数据已经到了

——————————————————————————————————————————————————————————————————————————————————————————

最后说下为啥要用这个命令转化

根据大佬说法。

这个命令是属于直接将hdfs文件转化为hbase的存储文件，不经过hbase的regionserver，不会影响hbase的查询和写入性能。

如果你使用hbase 读hive和写hbase的方法，1会影响hive的读，2会影响hbase的写性能，明显没有上面的好。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hbase之bulkload

需求。如何把hdfs的数据转入hbase？ datax？spark？flink？不不不，直接用hbase自带的命令即可。参考http://hbase.apache.org/2.2/book.html前提。hdfs存储格式为texthbase数据为列族是0 列名是ou_code ou_level1把数据放到hdfs上去。这个如果你的表存储格式为text直接用存储目录也行二将文件转化为hfilehbaseorg.apache.hadoop.hbase.map...
复制链接

扫一扫

专栏目录

cclovezbf CSDN认证博客专家 CSDN认证企业博客

码龄6年

232: 原创

2万+: 周排名

1万+: 总排名

47万+: 访问

: 等级

3812: 积分

249: 粉丝

419: 获赞

112: 评论

1061: 收藏

私信

关注

分类专栏

最新评论

windows环境下Invalid Spark URL: spark://HeartbeatReceiver@xxxx报错解决。
cclovezbf: 帮到你很开心
datax优化之reader提速-详细经历
ajievip: 用rdbmsreader 和writer肯定是没有问题的。
windows环境下Invalid Spark URL: spark://HeartbeatReceiver@xxxx报错解决。
xlong_28: 困扰了一个星期，安装了无数个版本配置环境，tb花钱远程也解决不了，最后这个帖子救了命！！我的主机名不带下划线，通过修改hosts文件指定localhost强制绑定主机名，和spark配置文件强制绑定主机名完美解决！！！感谢！
hadoop学习之WebHDFS (REST API)
cclovezbf: clouder manger 就是cdp cdh自带的
hadoop学习之WebHDFS (REST API)
TangAcrab: 用得什么工具看得 ui 哦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。