Hive远程模式部署参考:
一、Hive数据仓库应用之Hive部署(超详细步骤指导操作,WIN10,VMware Workstation 15.5 PRO,CentOS-6.7)
Hive同传统的关系型数据库一样含有大量内置函数,方便用户直接使用。Hive也支持用户自定义函数,可根据实际使用场景编写函数,如UDF(用户自定义函数)、UDTF(用户自定义表生成函数)和UDAF(用户自定义聚合函数)。
一、Hive内置函数
1、聚合函数
1.1 统计员工信息表employess_table中的部门数。
SELECT
COUNT(DISTINCT staff_dept) dept_num
FROM hive_database.employess_table;

1.2 获取商品销售表sales_table中每个省份销售额最高的城市。
SELECT
province,SUM(sales_amount) province_amount
FROM hive_database.sales_table GROUP BY province;

1.3 获取商品销售表sales_table中每个省份销售额最高的城市。
SELECT province,city,sales_amount
FROM hive_database.sales_table
WHERE sales_amount IN(
SELECT MAX(sales_amount)
FROM hive_database.sales_table
GROUP BY province);

1.4 获取商品销售表sales_table中每个省份包含的城市。
SELECT province,COLLECT_SET(city) city_set
FROM hive_database.sales_table
GROUP BY province;

2、数学函数
获取商品销售表sales_table中每个省份的平均销售额。
SELECT province,ROUND(AVG(sales_amount),2)
FROM hive_database.sales_table GROUP BY province;

最低0.47元/天 解锁文章
492

被折叠的 条评论
为什么被折叠?



