Hive中的查询语句和分组操作

最新推荐文章于 2024-08-25 03:55:02 发布

ZSup{A}

最新推荐文章于 2024-08-25 03:55:02 发布

阅读量1k

点赞数

分类专栏：大数据应用比赛文章标签： hive 数据库 sql

本文链接：https://blog.csdn.net/m0_62064241/article/details/125815392

版权

大数据应用比赛专栏收录该内容

12 篇文章 0 订阅

订阅专栏

本文介绍了Hive SQL的基本查询语法，包括全表查询、选择特定列、使用COUNT、MAX、MIN、SUM和AVG等聚合函数，LIMIT语句以及WHERE子句进行条件过滤。同时，讲解了比较运算符的使用，并展示了LIKE和RLIKE在模糊查询中的应用，以及GROUP BY语句在数据分组和聚合操作中的作用。

摘要由CSDN通过智能技术生成

1.查询语句：

2.基本查询（select...from）:(1)全表查询：

hive(default) > select * from emp;

hive(default) > select empno,ename,job,mgr,hiredate,sal,

comm,deptno from emp;

(2)选择特定列查询：

hive(default) > select empno,enmae from emp;

注：①SQL语言大小写不敏感

②SQL可以写在一行或者多行

③关键字不能被缩写也不能分行

④各子句一般要分行写

3.常用函数：（1）求总行数（count）：

hive(default) > select count(*) cnt from emp;

（2）求工资的最大值（max）：

hive(default) > select max(sal) max_sal from emp;

（3）求工资的最小值（min）：

hive(default) > select min(sal) min_sal from emp;

（4）求工资的总和（sum）：

hive(default) > select sum(sal) sum_sal from emp;

（5）求工资的平均值（avg）：

hive(default) > select avg(sal) avg_sal from emp;

4.Limit语句：典型的查询会返回多行数据。Limit子句用于限制返回的行数

eg. hive(default) > select from emp limit 5;

5.Where语句：（1）使用where子句，将不满足的行过滤掉

（2）where子句紧随from子句

eg.查询出薪水大于1000的所有员工

hive(default) > select * from emp where sal>1000;

注：where子句中不能使用字段别名

6．比较运算符（between/in/is null）：下面表中描述了谓词操作符，这些操作符同样可以用于join...on和having语句中

操作符	支持的数据类型	描述
A=B	基本数据类型	如果A等于B则返回true，反之返回false
A<=>B	基本数据类型	如果A和B都为NULL则返回true，如果一边为NULL，返回false
A<>B,A!=B	基本数据类型	A或B为NILL则返回NULL；如果A不等于B则返回true，反之返回false
A<B	基本数据类型	A或B为NULL，则返回NULL；如果A小于B，则返回true，反之返回false
A<=B	基本数据类型	A或B为NULL，则返回NULL；如果A小于等于B，则返回true，反之返回false
A>B	基本数据类型	A或B为NULL，则返回NULL；如果A大于B，则返回true，反之返回false
A>=B	基本数据类型	A或B为NULL，则返回NULL；如果A大于等于B，则返回true，反之返回false