提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
提示:这里可以添加本文要记录的大概内容:
例如:梳理impala的部分命令。
提示:以下是本篇文章正文内容,下面案例可供参考
一、impala是什么 ?
mpala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。
二、使用步骤
1.数据拼接
2.exists()
[ɪɡˈzɪsts] --> exists返回结果为True或False例如
select columns1 from t1 where exists (select * from t2 where t1.columns1 = t2.collumns2)
# 因为exists返回结果为True、False,所有不用在where中添加列
cast()
[kɑːst] --> cast()为数量类型转换,在计算过程中,我们需要对数据进行转化计算。
select cast('1' as int), cast(1 as float), cast(1 as string)
regexp_like()
对数据进行正则匹配,若匹配到数据就返回True,否则返回False。
select * from t1 where regexp_like(columns1, '[0-9]+小明')
# 匹配columns1中数据为0到9的数字加小明
nvl()
nvl2等其他命令
nvl(column1, column2) 当column1为空时,就显示column2;当column1不为空时,就显示column1
select nvl(null, 1) column1, nvl(2, 1) column2 from tabl
# column1显示1
# column2显示2