工作中涉及到了关系数据库和非关系数据库的数据转换,即mysql和hbase之间的数据转换,这里用到了sqoop进行数据转移。对hbase的操作除了自带的一些api,还用到了phoenix。使用crontabs定时完成sqoop创建的job的shell脚本完成自动化执行。通过phoenix链接hbase,再用scala语言,通过spark完成具体的大数据操作。
这里总结了一些具体用到的操作,刚开始写博客,有很多地方需要向前辈好好学习!加油!
文中若有内容错误,还请评论指出!谢谢!
1. hbase相关操作
用到的一些hbase基础api
1.1 创建hbase表 user,并有一个userinfo列簇
因为之后要用phoenix操作hbase,所以这里所有的表名和列簇都要用大写的,才不会有冲突
creat