2200W条数据测试phoenix查询性能

版本

hbase 1.3.5
phoenix 4.14.2-hbase 1.3

简介

这里的数据来源于网络,直接下载的用户电影打分数据,原数据集有2700W条,这里为了rowkey不重复,我将timestamp作为rowkey,最终获取到了2200W条数据

索引

这里一会儿要用上二级索引,所以这边先介绍一下,由于hbase中只能围绕rowkey设计来提高性能,但是我们引入了phoenix,可以将hbase和phoenix做关联表和关联视图,就可以引入二级索引了,效率确实提升很多

hbase配置

要打开二级索引,hbase-site.xml中需要打开配置

<property>
<name>hbase.regionserver.wal.codec</name>
<value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>
</property>

异步构建索引

由于2200W数据量还是蛮大的,直接构建出错的概率高达100%,毕竟我本人就构建失败了,所以这里推荐异步构建的方式

create index rating_index_user_item_local on RATINGLOCAL("info"."userId","info"."movieId") include ("info"."rating&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

局外人一枚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值