在整理完了Oracle、MySQL中如何通过SQL实现按天、自然周、月、季度、年份周期统计时,忽然想起在hive与impala中,SQL的语法也是不尽相同,但又有共通之处。
俗话说,授人予鱼,不若授人以渔。学习方法、解决问题的方法才是最重要的。
无论我们在哪种SQL搜索引擎上使用SQL进行查询与统计数据,我们都要遵从其适用的语法规则。如果不清楚你所用的SQL搜索引擎适用什么样的语法规则,最好的办法就是查找官方文档。只有官方文档才能给以权威的解释,便于高效率解决自己遇到的问题。
这是impala SQL的官方文档,遇到问题多读读官方说明。
https://www.cloudera.com/documentation/enterprise/5-9-x/topics/impala_datetime_functions.html
-
1. 按天统计
在impala里,from_timestamp()函数可以帮助实现常见的各种日期操作。这个函数与MySQL中的date_format()函数很相似,只要通过配置其format参数的值即可。format参数值的标准形式如下:
(yyyy-MM-dd HH:mm:ss.SSS )
select from_timestamp(first_buycar_time,'yyyy/MM/dd') as d,count(*)
from table
group by from_timestamp(first_buycar_time,'yyyy/MM/dd')
order BY d ASC
其结果如下所示:
- 2. 按自然周统计
为了让结果可读性更好一些,在这里使用concat()函数连接出一个字符串出来,详细指明这是某年的某周。
但cast()函数的参数必须为字符串,而weekofyear()函数返回值是一个int类型, 所以这里还需要再利用cast()函数转换一下数据类型。
select concat(cast(year(first_buycar_time) as STRING),'年第',cast(weekofyear(first_buycar_time) as string),'周') as w,count(*)
from table
group by concat(cast(year(first_buycar_time) as STRING),'年第',cast(weekofyear(first_buycar_time) as string),'周')
order BY w ASC;
输出结果如下所示:
- 3. 按月统计
format参数值为’yyyy/MM’即可实现按月统计:
select from_timestamp(first_buycar_time,'yyyy/MM') as m,count(*)
from table
group by from_timestamp(first_buycar_time,'yyyy/MM')
order BY m ASC
其结果如下所示:
- 4. 按季节统计
值得注意的是trunc()函数虽然提供了按照季节周期统计的功能,但其返回值却不是很友好。它返回的是每个季度的起始月信息:
返回值为:‘2019-01-01 00:00:00’,则表示第一季度
返回值为:‘2019-04-01 00:00:00’,则表示第二季度
返回值为:‘2019-07-01 00:00:00’,则表示第三季度
返回值为:‘2019-10-01 00:00:00’,则表示第四季度
select trunc(first_buycar_time,'Q') as y,count(*)
from table
group by trunc(first_buycar_time,'Q')
order BY y ASC
返回结果如下所示:
- 5. 按年统计
format参数值为’yyyy’即可实现按年统计:
select from_timestamp(first_buycar_time,'yyyy') as y,count(*)
from table
group by from_timestamp(first_buycar_time,'yyyy')
order BY y ASC
其结果如下所示:
👏👏👏再看看我们以前的文章😃😃😃
🌺 Excel中数据分析工具库-相关系数篇
🌺 干货,手把手教会你做相关性分析
🌺 5年数据分析路,小结。
🌺 用户细分及画像分析
🌺 K-近邻算法及实践
欢迎关注,微信公众号“数据分析师之家”
扫描二维码 关注我们
💁提供职业规划、简历指导、面试辅导服务哦
QQ交流群:254674155
数据分析之家联合JEE RAY品牌为粉丝派发福利
添加粉丝福利派发官,领取粉丝福利哦