数仓
哥伦布112
Apache IoTDB contributor
https://github.com/WilliamSong11/iotdb
展开
-
2020-11-30
sparkSql 当前时间 前N小时 select from_unixtime(unix_timestamp(current_timestamp) - 1* 60 * 60 *N,‘yyyy-MM-dd HH:mm:ss’) as sub原创 2020-11-30 15:32:29 · 309 阅读 · 1 评论 -
2020-11-30
hvie 窗口函数 目录 1 窗口函数 Windowing functions 2 OVER详解 The OVER clause 2.1 标准聚合函数 2.2 分析函数 Analytics functions 2.3 OVER子句也支持聚合函数 2.4 window clause 的另一种写法 1 窗口函数 Windowing functions FIRST_VALUE(col, bool DEFAULT) 返回分组窗口内第一行col的值,DEFAULT默认为false,如果指定为true原创 2020-11-30 15:25:03 · 314 阅读 · 0 评论 -
hive中内部表及外部表特性差异
关键点: ARCHIVE/UNARCHIVE/TRUNCATE/MERGE/CONCATENATE命令只能在内部表上进行使用; DROP操作将会删除内部表的元数据及数据信息,而对于外部表则仅仅删除元数据信息; ACID的事务特性仅仅适用于内部表; 查询结果缓存只适用于内部表; 外部表的表约束只支持RELY操作; 一些物化视图的特性只适用于内部表; hive中表的两种基本类型 1)、内部表(managed)--默认 2)、外部表(external) 简介 本文将介绍内部表及..原创 2020-09-01 17:40:09 · 648 阅读 · 0 评论 -
有关用户留存模型的一种设计方法
没错,我的工种就是属于那种史上被人吐槽为最没技术含量、最打杂的工种——数据仓库开发工程师。 即使这样,我们也没有放弃理想啊,每天都在思考怎么把工作做的更好,即使打杂,也要打的优雅~~ 今天分享一个用户留存模型的设计 1、抛出问题 用户留存是用户分析中最常用到的指标之一。 我们常常接到这样的需求: ~我们要看1天、2天、3天、4天 … 7天的留存~ ~我们要看1天、2天、3天、4天 … 28天的留存~ 还有一些不按套路出牌的: ~我们要看第33天的留存~ ...原创 2020-07-26 18:32:20 · 754 阅读 · 0 评论