HiveQL 查询

最新推荐文章于 2018-10-23 23:16:16 发布

eiffel_0311

最新推荐文章于 2018-10-23 23:16:16 发布

阅读量7.5w

点赞数

分类专栏： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eiffel_0311/article/details/51360233

版权

hive 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1. 创建表

CREATE TABLE employees (

name STRING,

salary FLOAT,

subordinates ARRAY<STRING>,

deductions MAP<STRING, FLOAT>,

address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>

)

PARTITIONED BY (country STRING, state STRING)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ','

COLLECTION ITEMS TERMINATED BY '|'

MAP KEYS TERMINATED BY ':';

数据内容：

John Doe,100000.0,MarySmith|Todd Jones,Federal Taxes:.2|State Taxes:.05|Insurance:.1,1 MichiganAve.|Chicago|IL|60600

MarySmith,80000.0,Bill King,Federal Taxes:.2|State Taxes:.05|Insurance:.1,100Ontario St.|Chicago|IL|60601

ToddJones,70000.0,,Federal Taxes:.15|State Taxes:.03|Insurance:.1,200 ChicagoAve.|Oak Park|IL|60700

BillKing,60000.0,,Federal Taxes:.15|State Taxes:.03|Insurance:.1,300 ObscureDr.|Obscuria|IL|60100

2. 基本查询：

查询整个表： select * from employees;

查询单个字段： select name from employees;

查询数组： select subordinates from employees;

select subordinates[0] from employees;

查询MAP: select deductions from employees;

select deductions['Federal Taxes'] from employees;

查询结构体： select address from employees;

select address.street from employees;

使用分区过滤： select * from employees where country = 'CHINDA';

可以使用任意字段放在where 谓词中

3. 数据函数，计算数值

select bigint(salary) from employees;

4. 聚合函数

select sum(salary) from employees group by country;

select sum(salary) from employees group by address.street;

5. 表生成函数，一个字段裂成多行

select explode(subordinates) as sub from employees;

另外更多内置函数，可查询文档

6. 嵌套查询

select tmp_table.name from (select name, salary from employees) tmp_table;

7. case when

select sum(case when country = 'US' then salary end) as cc from employees group by country;

8. sort by 和 order by

order by 是正常排序

sort by 会现在每个reducer 中先执行排序

9. distribute 按某个字段分区后在每个reducer上排序

select country, state, name, salary from employees distribute by country sort by country, state;

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HiveQL 查询

1. 创建表CREATE TABLE employees (name STRING,salary FLOAT,subordinates ARRAY,deductions MAP,address STRUCT)PARTITIONED BY (country STRING, state STRING)ROW FORMAT DELIMITEDFIELDS TE
复制链接

扫一扫

专栏目录

eiffel_0311 CSDN认证博客专家 CSDN认证企业博客

码龄15年

59: 原创

5万+: 周排名

37万+: 总排名

406万+: 访问

: 等级

5732: 积分

29: 粉丝

36: 获赞

9: 评论

75: 收藏

私信

关注

热门文章

分类专栏

elasticsearch 1篇
图解 4篇
clickhouse 1篇
spark 3篇
算法 1篇
code demo 3篇
docker 1篇
ruby 8篇
scala 9篇
linux 1篇
python
hive 6篇
postgres
flume 2篇
练习 17篇
爬虫 4篇
其他 1篇

最新评论

短网址简介
skey123123: zzdwz点cn的短网址，免费接口API生成。
IK 分词器空格支持
qq_42630566: 你好，这个第一张图截取的不完整啊！后面|后面是什么呢？然后我后面的没加分词分出来的还是不能完整保留带空格的术语词。
个人建站基本流程
前端宋: 关于腾讯云服务器选择，一看平台，再看配置，最后是机型，我看了网上这篇博文，很全，http://www.aliyunbc.com/newsinfo/1157113.html
redash on spark-thriftserver
面壁者-肖叮: host填什么？
个人建站基本流程
我是海贼王路飞啊: 博主辛苦了！但是这篇文章很多地方没讲清楚。比如说怎样进入命令行模式，怎样搭建数据库等。我摸索了很久，还是没能弄好。最终我还是使用腾讯云开源应用中心(https://app.cloud.tencent.com)，对我这样计算机知识不够丰富的比较友好。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。