impala命令

打工人神

于 2023-03-07 11:31:41 发布

阅读量1.1k

点赞数

文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/shenhuajiushiwo/article/details/129357932

版权

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

impala

前言
一、impala是什么？
二、使用步骤

前言

提示：这里可以添加本文要记录的大概内容：

例如：梳理impala的部分命令。

提示：以下是本篇文章正文内容，下面案例可供参考

一、impala是什么？

mpala是Cloudera公司主导开发的新型查询系统，它提供SQL语义，能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性。相比之下，Impala的最大特点也是最大卖点就是它的快速。

二、使用步骤

impala字符串函数最全版

1.数据拼接

在这里插入图片描述

2.exists()

[ɪɡˈzɪsts] --> exists返回结果为True或False例如

select columns1 from t1 where exists (select * from t2 where t1.columns1 = t2.collumns2)
# 因为exists返回结果为True、False，所有不用在where中添加列

cast()

[kɑːst] --> cast()为数量类型转换，在计算过程中，我们需要对数据进行转化计算。

select cast('1' as int), cast(1 as float), cast(1 as string)

regexp_like()

对数据进行正则匹配，若匹配到数据就返回True，否则返回False。

select * from t1 where regexp_like(columns1, '[0-9]+小明')
# 匹配columns1中数据为0到9的数字加小明

nvl()

nvl2等其他命令
nvl(column1, column2) 当column1为空时，就显示column2；当column1不为空时，就显示column1

select nvl(null, 1) column1, nvl(2, 1) column2 from tabl
# column1显示1
# column2显示2