2200W条数据测试phoenix查询性能

最新推荐文章于 2022-12-15 15:41:04 发布

局外人一枚

最新推荐文章于 2022-12-15 15:41:04 发布

阅读量2.2k

点赞数

分类专栏： phoenix

本文链接：https://blog.csdn.net/weixin_42814075/article/details/95450741

版权

版本

hbase 1.3.5
phoenix 4.14.2-hbase 1.3

简介

这里的数据来源于网络，直接下载的用户电影打分数据，原数据集有2700W条，这里为了rowkey不重复，我将timestamp作为rowkey，最终获取到了2200W条数据

索引

这里一会儿要用上二级索引，所以这边先介绍一下，由于hbase中只能围绕rowkey设计来提高性能，但是我们引入了phoenix，可以将hbase和phoenix做关联表和关联视图，就可以引入二级索引了，效率确实提升很多

hbase配置

要打开二级索引，hbase-site.xml中需要打开配置

<property>
<name>hbase.regionserver.wal.codec</name>
<value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>
</property>

异步构建索引

由于2200W数据量还是蛮大的，直接构建出错的概率高达100%，毕竟我本人就构建失败了，所以这里推荐异步构建的方式

create index rating_index_user_item_local on RATINGLOCAL("info"."userId","info"."movieId") include ("info"."rating&

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

局外人一枚

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

phoenix 性能测试

weixin_40875934的博客

12-06

3732

1、环境详情 **·**1台HMaster 2台HRegionServer 2、创建一张订单表 **·**create table if not exists order_1 (id varchar primary key,sale_amount double,discount_amount double,current_time varchar); 3、生成模拟订单数据 · 注：upser...

phoenix性能测试(含测试代码和问题解决)

cclovezbf的博客

04-15

2160

目前公司搭建cdh，要我测试hbase和phoenix的性能问题 hbase测试有自带的pe工具 phoenix没有，所以采用java api连接的方式进行测试，hbase 2.0 phoenix5.0 <dependency> <groupId>org.apache.phoenix</groupId> ...

参与评论您还未登录，请先登录后发表或查看评论

Phoenix基础性能测试

weixin_34417183的博客

08-20

940

2019独角兽企业重金招聘Python工程师标准>>> ...

HBase Phoenix助力海量数据实时分析

weixin_34228387的博客

05-18

499

前言 phoenix这个项目我一直接触不多，在去年接触的一家公司使用phoenix分析数百亿的记录并且在秒级别返回的延迟时，笔者才慢慢探究一些phoenix的内幕。上个星期跟一位phoenix的PMC&Committer聊了聊phoenix的定位及未来的发展，发现phoenix还是比较竞争力的，从最近phoenix不断的发布版本来看，phoeni...

phoenix-performance:用于表征 Apache Phoenix 性能的测试套件

06-21

示例说明： # Build data. This sample is for a small sandbox. ./generate_data.sh 2 && \ ./load_data.sh 2 sandbox.hortonworks.com:2181:/hbase-unsecure # Edit testhosts to specify the hosts that will run JMeter. # Assumes passwordless SSH access. # Setup the test environment. ./build_driver.sh && \ ./setup_testenv.sh

phoenix查不到数据_Phoenix查询测试经验总结

weixin_39632293的博客

12-20

1251

1. 背景适当的索引能够让极大提升查询速度，因此在Phoenix查询的测试用例中包括了对有索引跟无索引的查询性能的比较。测试过程中遇到一些问题，在此记录下来。2. 问题及解决2.1. 创建索引时报错，报错如下：//创建索引语句：0: jdbc:phoenix:localhost> CREATE INDEX ind_1 ON TESTINPUT(ff1);//报错：Error: ERROR 1...

kettle操作mysql，hive，hbase，phoenix性能测试(使用笔记性能测试部分补充和更新)...

qq_26777585的博客

02-09

118

注：前提不泄露公司信息 Mysql数据库连接主机名或 IP 地址: xxx 端口: xxx 数据库：xxx 用户名: xxxx 保存密码: xxxx...

HBase系列（八）Phoenix操作HBase

Wei_HHH的博客

01-25

2472

Phoenix操作HBase一、Phoenix简介二、安装部署三、Phoenix实操访问Phoenix 一、Phoenix简介 Hbase适合存储大量的对关系运算要求低的NOSQL数据，受Hbase 设计上的限制不能直接使用原生的PAI执行在关系数据库中普遍使用的条件判断和聚合等操作。 Apache Phoenix 是 HBase 的 SQL 驱动。Phoenix 使得 HBase 支持通过 JDBC 的方式进行访问，并将你的 SQL 查询转成 HBase 的扫描和相应的动作。Phoenix 基于Hbase

Phoenix查询效率

02-21

1172

Phoenix优势： 1.动态的将一个查询转换为多个scan并行执行，使用startRowKey和stopRowKey进行拆分； 2.使用hbase0.94版本及之后的coprocessor特性； 3.Filter。测试集群： 2个4核的虚拟机环境，执行查询条件，从999,9999行的数据中计数其中111,1111行，用时4s。

Phoenix存储与查询性能研究

cxy_19891109的博客

11-29

1084

1、前期准备数据表：轨迹信息表：TRACE_INFO 2、插入数据研究目前不支持批量插入数据的接口，模拟只能循环插入数据，测试一个批量插入100000条数据，平均时间大概在190s。目前表里已经有1000000条数据： 3、根据条数限制查询查询100条（0.314s）： 4、根据某个ID进行查询(0.175s) ID 是唯一的主键 5、根据订单号进行查询（非主键，也无索引）（7...

phoenix 通过JDBC方式导入CSV文件性能测试

雨人的博客

07-17

437

最近研究了一下 phoenix 基于JDBC方式导入的性能问题，测试环境： hadoop (2.3.0+cdh5.0.0+548)hbase(0.96.1.1+cdh5.0.0+60) phoenix4.0.0.0 创建表tab_ps_xdr2, 带有4个索引列分别创建4个索引表，如下： create table TAB_PS_XDR2 ( K VARCHAR NOT NULL PRI...

Hbase性能优化【Phoenix、Hive集成HBase】

lyq7269的博客

07-21

1483

一、Phoenix概述 Phoenix简介构建在HBase上的SQL层使用标准SQL在HBase中管理数据使用JDBC来创建表，插入数据、对HBase数据进行查询 Phoenix JDBC Driver容易嵌入到支持JDBC的程序中 Phoenix使HBase更易用 Phoenix应用场景 Phoenix适合场景快速而容易地构建基于HBase的应用程序需要极大的规模、性能和并发性的SQL应用程序在转换到Hadoop时重用已有的SQL技能 BI工具（对SQL支持较好） Phoenix不适合

Apache Phoenix部署和测试

DataFlow范式

08-30

5836

Apache Phoenix是一个HBase的开源SQL引擎。你可以使用标准的JDBCAPI代替HBase客户端API来创建表，插入数据，查询你的HBase数据。为了你更好更快地了解Apache Phoenix，官方给出了15分钟快速了解Apache Phoenix的文档说明：http://phoenix.apache.org/Phoenix-in-15-minutes-or-less.html

Phoenix--构建二级索引加快查询效率

qq_46893497的博客

12-21

557

使用Phoenix构建二级索引加快查询效率配置HBase支持Phoenix二级索引使用Phoenix创建二级索引 HBase通过rowkey来查询，否则就必须逐行地比较每一列的值，即全表扫瞄数据量较大的表，全表扫描的性能很差如果需要从多个角度查询数据，不可能使用 rowkey 来实现查询。此时可使用secondary index（二级索引）来完成这件事 Phoenix提供了对HBase secondary index的支持配置HBase支持Phoenix二级索引 1、在每一个 HRegionSe

大数据学习整理篇（十四）Phoenix 5.0.0+HBase2.0测试环境Docker镜像，支持二级索引，优化查询性能（下）

astra_zhao的专栏

12-08

613

首先感谢iteblog，在他的基础上将之前Hbase2.0.6改成了Hbase2.0.0版本，这样，就可以正常使用Phoenix的二级索引功能，具体操作如下： 1.将https://gitee.com/astra_zhao/hbase-docker的Dockerfile进行修改，主要修改 ENV HBASE_VERSION 2.0.6改成 ENV HBASE_VERSION 2.0.0 2.修改hbase-site.xml，加入下面的内容 <property> <nam

Phoenix性能优化

vicleev的博客

10-09

1920

1. 建表优化 Salting 翻译成中文是加盐的意思，本质是在hbase的rowkey的byte数组的第一个字节位置设定一个系统生成的byte值，这个byte值是由主键生成rowkey的byte数组做一个哈希算法，计算得来的。Salting之后可以把数据分布到不同的region上，这样有利于phoenix并发的读写操作。示例： CREATE TABLE TEST (HOST VARCHAR...

Hbase和Phoenix二级索引测试

qiangzi_lg的博客

12-15

422

本文主要测试Phoenix二级索引。

phoenix offset跳过多条查询速度慢