hbase数据加盐读取（spark篇）

最新推荐文章于 2023-02-10 10:07:50 发布

weixin_30337157

最新推荐文章于 2023-02-10 10:07:50 发布

阅读量306

点赞数

文章标签：大数据

原文链接：http://www.cnblogs.com/ww5566/p/11459026.html

版权

未加盐数据：spark可以使用inputformat、outputformat来读写hbase表。

加盐以后：需要在rowkey之前加一些前缀，否则是查不到数据的。

1）我们需要重新写getsplits方法：从名字我们可以知道是要计算有多少个splits。在hbase中，一个region对用一个split，对应于tablesplit实现类。

tablesplit的构造需要传入startrow和endrow。

2）我们可以通过RegionLocator 的 getStartEndKeys()拿到某张表所有 Region 的 StartKeys 和 EndKeys 的，然后将拿到startkey和用户传进来的startrow和endrow进行拼接。　

转载于:https://www.cnblogs.com/ww5566/p/11459026.html

weixin_30337157

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hbase数据加盐读取（spark篇）

未加盐数据：spark可以使用inputformat、outputformat来读写hbase表。加盐以后：需要在rowkey之前加一些前缀，否则是查不到数据的。1）我们需要重新写getsplits方法：从名字我们可以知道是要计算有多少个splits。在hbase中，一个region对用一个split，对应于tablesplit实现类。tablesplit的构造需要传入sta...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。