
impala
zxfBdd
这个作者很懒,什么都没留下…
展开
-
Impala安装和使用问题汇总
近日调研了Kudu+Impala大数据存储引擎,在安装和使用的过程中也遇到不少问题,解决起来也是不容易(lz比较菜鸟),在这里记录一下,也当是分享吧。1.Impala不能创建表,提示权限的问题具体情况: [data.beta.com:21000] > create table user_data(user_id string,code string,value string); Query: create table user_data(user_id stri...转载 2020-10-28 20:54:59 · 1035 阅读 · 0 评论 -
基于hive-testbench实现TPC-DS测试
文章目录 TPC-DS测试概述 1. TPC-H 2. TPC-DS 使用hive-testbench生成hive基准测试数据 1.环境准备 拉取代码 安装gcc 安装maven 2.执行编译 3.生成数据并加载到hive中 4.使用Hue验证数据 5.生成数据时的一些异常处理 Permission denied: user=root, access=WRITE File do...转载 2020-10-26 20:30:33 · 806 阅读 · 4 评论 -
【Hive】开源Hive基准测试工具使用(hive-testbench-hive14)
Hive基准测试工具工具,可用来造数测试Hive基本性能Github:https://github.com/hortonworks/hive-testbench/TPC-DS:提供一个公平和诚实的业务和数据模型,99个案例 TPC-H:面向商品零售业的决策支持系统测试基准,定义了8张表,22个查询 wget https://github.com/hortonworks/hive-testbench/archive/hive14.zip unzip hive14.zip...转载 2020-10-26 20:28:53 · 669 阅读 · 0 评论 -
Hive使用with...as建立子查询
基本格式with sub_query_name1 as ( select xx from xxx), -- 注意这里用逗号分割sub_query_name2 as ( --注意这里没有as,上面一个as跟多个sub_query select xx from xx)select --正式查询语句,与上面的with as直接没有符号分割 xxfrom xx注意事项sub_query直接用逗号分割,一个sub_query用圆括号扩起来 with 只能...转载 2020-10-26 18:16:06 · 895 阅读 · 0 评论 -
HIVE新增表在Impala中不能及时查看问题
这里基于CDH部署安装的HIVE和Impala,当我们在HIVE中新增一张表时,我们发现在Impala中不能及时查看到新增表,这是因为元数据信息没有及时刷新,在impala里执行invalidate metadata命令刷新元数据即可。这里我们简单测试HIVE中新建一张表并查看CREATE TABLE test_01(id INT,name STRING,sex STRING,dataday STRING);--HIVE中查看新增表hive> show tables;OKte...转载 2020-10-26 17:54:20 · 557 阅读 · 0 评论 -
hive 删除udf函数
https://community.cloudera.com/t5/Support-Questions/DROP-FUNCTION-IF-EXISTS-udf-fails-with-quot-function-udf/td-p/92001https://docs.cloudera.com/documentation/enterprise/5-9-x/topics/impala_drop_function.htmlhttps://community.cloudera.com/t5/Support-Q...转载 2020-09-16 15:40:29 · 3476 阅读 · 1 评论 -
获取impala下所有的数据库建表语句
本博文介绍三种方法,推荐使用第三种,前两种都是尝试。方法一:现在的导出还是有缺陷的,导出的文件中还是存在其他不必要的信息#!/bin/bash##获取数据库databases=$(hive -e "show databases; exit;") for database in $databases;do #获取hive建表语句 tables=$(hive -e "use $database; show tables;") for...转载 2020-07-21 18:46:48 · 3446 阅读 · 1 评论 -
impala--NDV()函数
使用impala查询引擎的时候,如果count(disticnt column)数据量过大会报错,报错内容正在提取遇到以下错误的结果:org.apache.hive.service.cli.HiveSQLException: AnalysisException: all DISTINCT aggregate functions need to have the same set of...转载 2019-11-14 18:49:41 · 2431 阅读 · 0 评论