24届好未来数开笔试

选择、多选

Java, int x = 1, float y = 2, x/y =

0.5
2. Hive 的数据结构

基本数据类型
在这里插入图片描述

复合数据类型

在这里插入图片描述
text 不是

  1. Hive 内外表
    建表时如果不显示声明表的类型为 外表

  2. Kafka 通过()避免任务重复执行
    对每个Producer分配唯一ID

  3. 雪花模型比星型模型更适合于多维分析 ?不确定,应该是对的

  4. HDFS中的block默认保存
    3份

  5. LSM的含义是
    日志结构合并树

  6. HIve实现连续排序,相同值并列排名
    dense_rank()
    速记
    row_number() over(): 123
    dense_rank() over(): 112
    rank() over(): 113

  7. Hive存储格式是列存储的有哪些
    orc(列式存储)、parquet(列式存储)
    速记
    textfile(行式存储) 、sequencefile(行式存储)、orc(列式存储)、parquet(列式存储)

  8. 属于TCP/IP协议应用层是有
    HTTP、FTP、SMTP、POP3 等协议

SQL

题目描述

求每个部门的用户访问量Top3

输入

visit_log

user_idshop
u1a
u1a
u1b
u2a
u2a
u2b
u3a
u3a
u3a
u3b

目标

shopuser_idcnt
au33
au12
au22
bu11
bu21
bu31

解答

with tmp as

(select shop, user_id, count(*) cnt

from visit_log)

, tmp2 as

(select shop, user_id, cnt, row_number() over(partition by shop order by cnt desc) rn

from tmp)

select shop, user_id, cnt

from tmp2

where rn <= 3

group by shop

order by cnt desc;

解析

tmp 表统计每个部门的用户访问量
tmp2 表添加伪列排序
然后再筛选前三即可

题目分享

Hive 精选选择题

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

是小白_鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值