![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数仓+BI
文章平均质量分 63
逃跑的沙丁鱼
奋力起飞的菜鸟
展开
-
rank()dens_rank() row_number()区别
1 建测试表CREATE TABLE `user_login`( `brandid` int, `userid` string, `logindate` string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS ORC;2 造数据insert into user_login (brandid,userid,logindate) VALUES (429,'1001','2021-05-01'),(42原创 2021-05-10 11:05:27 · 487 阅读 · 2 评论 -
intellij 通过database 连接hive
1 下载依jar备用hive-jdbc-uber-2.6.5.0-292.jar2 删除intellij 原有jar3 添加自己下载的driver包hive-jdbc-uber-2.6.5.0-292.jar4 配置HiveServer2点击 “+”号输入自定义名称,hiveservice2 所在主机ip,hiveserver2端口号,登录主机的用户名和密码点击ok后5 配置显示的hive库默认只显示default6 测试查...原创 2021-05-10 10:29:45 · 1478 阅读 · 2 评论 -
clickhouse分区操作实践
ClickHouse支持PARTITION BY子句,在建表时可以指定按照任意合法表达式进行数据分区操作,比如通过toYYYYMM()将数据按月进行分区、toMonday()将数据按照周几进行分区、对Enum类型的列直接每种取值作为一个分区等。数据Partition在ClickHouse中主要有两方面应用:在partition key上进行分区裁剪,只查询必要的数据。灵活的partition expression设置,使得可以根据SQL Pattern进行分区设置,最大化的贴合业务特点。对part原创 2020-12-09 00:00:01 · 14285 阅读 · 1 评论