Hive QL场景题第五部分详解

本文详细讲解了如何使用Hive SQL进行数据统计,包括PV/UV计算、数据集差集查询、连续购买行为分析以及用户首次行为与连续登录天数的统计。通过实例解析,帮助理解Hive在大数据处理中的应用。
摘要由CSDN通过智能技术生成

21、使用sql实现如下:

样例数据: t1表

gender,cookie,ip,timestampe,ua 

F,1707041428491566106,111.200.195.186,1208524973899,Dalvik%2F2.1.0%20%28Linux%3B%20U%3B%20Android 

...具体数据如下图

将图片中的awk修改为使用sql编写,然后将上诉题作出回答?

统计pv/uv的使用sql,其它问题语言描述即可。

22、使用hive求出两个数据集的差集?

数据 diff_t1表:

id name 
1 zs
2 ls

diff_t2表:

id name 
1 zs
3 ww

结果如下:

id name 
2 ls 
3 ww 
create table diff_t1( 
id string, 
name string 
)
row format delimited 
fields terminated by ' ' 
;
​
load data local inpath './hivedata/diff_t1.txt' overwrite into table diff_t1; 
create table diff_t2( 
id string, 
name string 
)
row format delimited 
fields terminated by ' ' 
;
​
load data local inpath './hivedata/diff_t2.txt' overwrite into 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值