HBASE批量数据导入

最新推荐文章于 2022-12-14 16:18:06 发布

zhangxiong0301

最新推荐文章于 2022-12-14 16:18:06 发布

阅读量277

点赞数

分类专栏： HBASE BULKLOAD HADOOP 文章标签： hbase

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangxiong0301/article/details/84609944

版权

HADOOP 同时被 3 个专栏收录

39 篇文章 0 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

把MYSQL中的数据导入到hbase中，采用HBASE自带的BULK加载工具完成。过程分三步：
1.从mysql中导出数据为CSV或TSV格式的文本文件
2.利用importtsv工具转换Tsv文件为hbase的数据文件格式HFILE
3.利用completeulkload加载上一步生成的hbase数据文件

具体步骤：
1.导数据：
select concat(model,'_',pkg_name,'_',meid),meid,model,pkg_name,label,install_type,genera_type,specific_type into outfile '/home/zx/d02.txt' fields terminated by '\t' lines terminated by '\n' from tb_yl_device_app_info_5230 ;

2.文件转换
hbase org.apache.hadoop.hbase.mapreduce.Driver importtsv -Dimporttsv.columns=HBASE_ROW_KEY,cf:meid,cf:model,cf:pkg_name,cf:label,cf:install_type,cf:genera_type,cf:specific_type -Dimporttsv.bulk.output=/user/hadoop/mysqldata/ tb_yl_device_app_info1 /home/hadoop/device_app/zx/

3.加载hbase
hbase org.apache.hadoop.hbase.mapreduce.Driver completebulkload /user/hadoop/mysqldata/ tb_yl_device_app_info1

注意：
在执行第二步的时候可能会报错java.lang.NoClassDefFoundError: com/google/common/collect/Multimap，
只需要将guava-11.0.2.jar考到hadoop的lib目录下就OK，附件是这个jar

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zhangxiong0301 CSDN认证博客专家 CSDN认证企业博客

码龄14年

163: 原创

43万+: 周排名

230万+: 总排名

7万+: 访问

: 等级

523: 积分

6: 粉丝

16: 获赞

2: 评论

73: 收藏

私信

关注

热门文章

分类专栏

MYSQL 18篇
REDIS 2篇
JAVA WEB 2篇
HADOOP 39篇
JAVA 20篇
LINUX 26篇
HBASE 25篇
BULKLOAD 1篇
SPARK 6篇
HIVE 12篇
ZOOKEEPER 1篇
杂记 2篇
KAFKA 1篇
scala 1篇
WEB开发 4篇
算法 3篇

最新评论

Spark Streaming容错的改进和零数据丢失（转）
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客真的很有价值！从标题中可以看出，Spark Streaming容错的改进和零数据丢失是一个非常重要的话题，对于大数据处理和分析来说至关重要。我觉得CSDN博主可以进一步深入探讨如何利用Spark Streaming实现实时数据处理的高可靠性和无数据丢失，例如可以写一篇关于“基于Spark Streaming的数据处理流程优化和容错机制实现”的技术博客，这样的技术文章对其他用户也会有很大的帮助。期待CSDN博主的下一篇精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
HIVE跑mapjoin时所有任务失败--问题分析及解决
qq_16259083: 我的join是没有on条件的，也是停在0%，0%，正在尝试你的办法。。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。