![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 86
小萝卜算子
这个作者很懒,什么都没留下…
展开
-
数仓面试——补充缺失日期和数据
补充缺失的日期行, 以及补充其他对应的数据,从思路分析到解决问题,三种不同方式让大家更熟悉窗口函数,不同的思路,不一样的风景呢。。。原创 2023-03-09 14:57:21 · 530 阅读 · 1 评论 -
数仓面试——日期交叉问题
数据仓库面试题,日期交叉问题,从易到难,简单明了,阐明此问题sql的多种写法,欢迎交流原创 2023-03-02 11:29:25 · 285 阅读 · 0 评论 -
数仓面试——连续登录问题进阶版
连续登录问题是一个经典问题,现在加大难度,中间间隔一天也算连续登录,要人命啊,该怎么写呢。。。原创 2023-03-02 09:14:28 · 163 阅读 · 0 评论 -
数仓面试——连续登录问题
连续登录问题,是一个经典sql,本文从易到难,简单拓展,连续登录问题不再是问题。。。原创 2023-03-01 16:25:15 · 232 阅读 · 0 评论 -
转型【数仓开发】该怎么学
学习+练习+思考+大量练习原创 2023-03-01 14:28:57 · 283 阅读 · 0 评论 -
大数据开发轻量级入门方案
经过这么多年的发展,大数据的技术正处于群雄逐鹿阶段 ,面对这么多技术框架,我们得学会做减法原创 2023-03-01 09:37:04 · 251 阅读 · 0 评论 -
OLAP | 基础知识梳理
还是得自己整理,梳理一遍后,清晰多了原创 2023-02-28 09:51:16 · 436 阅读 · 0 评论 -
你阅读源码的心态是什么?有哪些经验分享?
如果你家里没矿,请问做什么不苦逼? 这篇主要分享我阅读源码的一些方法和心态,共勉!原创 2023-02-28 10:30:36 · 111 阅读 · 0 评论 -
你为什么从java开发转大数据? 大数据方向能走的更远吗?
我想说如果选择了一条路,那就放开去拼一把,认真实践,会有所收获。人生路上,走的每一步都算数~原创 2023-02-28 09:20:14 · 1232 阅读 · 0 评论 -
数据仓库开发人员怎么避免成为取数机器?
从事互联网数据仓库工作好多年了,其中最大的感触就是数据仓库开发人员每天做的最多的工作就是为业务方取数。简单重复的取数工作,一方面很难让大家在技能上有提高,另一方面也慢慢的消磨了大家的积极性和意志,也让大家极没有存在感。原创 2023-02-27 16:44:33 · 134 阅读 · 0 评论 -
关于【你们数据仓库是怎么设计的】如何回答?
你们数据仓库都是怎么设计的,数据怎么抽象?关于这个问题,我说一说我的想法,不一定是正确的,但希望能给你提供一些思路原创 2023-02-27 16:33:25 · 602 阅读 · 0 评论 -
数仓字段血缘解析实现—hive版
字段血缘关系的一种实现方式原创 2023-02-27 10:11:50 · 1322 阅读 · 0 评论 -
有关用户留存模型的一种设计方法
有关用户留存模型的一种设计方法原创 2023-02-26 16:43:28 · 219 阅读 · 0 评论 -
澄清 | snappy压缩到底支持不支持split? 为啥?
凡是稍微有点深度的有问题,从网上求答案,真的是太难了......原创 2023-02-15 11:22:44 · 801 阅读 · 1 评论 -
Sparksql Expression的canonicalized(规范化)操作
Spark sql Expression的canonicalized(规范化)操作原创 2023-02-14 16:58:10 · 187 阅读 · 1 评论 -
Spark sql 谓词下推之CombineFilters及可以改进的地方
CombineFilters优化器还可以再做一些改进呀原创 2023-02-14 16:41:19 · 121 阅读 · 0 评论 -
spark sql非join情况的谓词下推优化器PushPredicateThroughNonJoin
PushPredicateThroughNonJoin是sparksql中非join情况的谓词下推的逻辑执行计划优化器原创 2023-02-13 17:38:11 · 142 阅读 · 0 评论 -
Spark sql逻辑执行计划优化器——EliminateOuterJoin【消除outerjoin】
所有优化器的前提:不影响查询结果,即要保证优化前和优化后两个sql执行的效果相同EliminateOuter原创 2023-02-14 16:11:04 · 138 阅读 · 0 评论 -
spark sql join情况下谓词下推优化器PushPredicateThroughJoin
为了更好理解PushPredicateThroughJoin优化器,先把EliminateOuterJoin 优化器看了~~原创 2023-02-14 15:15:42 · 374 阅读 · 0 评论 -
Spark sql Expression的deterministic属性
Spark sql Expression的deterministic属性对于算子树优化中判断谓词能否下推等很有必要原创 2023-02-13 16:34:24 · 194 阅读 · 0 评论 -
刚做数仓方向,你是不是有点迷茫?
可是,现在,就说现在,至少,我还是在数据仓库这个方向上混,那我就想着,怎么把这块的工作做好,自己沟通能力不太好,面对不同的人,不同的部门不知道该怎么协调,那就迎难而上,锻炼这方面的能力。自信心不是说,解决一个大问题才会让你感觉自信心爆棚,恰恰相反,自信心的建立是来自小的事情上的培养,把一件件小的事情,不起眼的事,做好,做的到位,你真的就已经很棒。或许,现在研究的这些技术,对于多年以后的我没有太大的用处,但在这个过程,练就的一些品质,一定会帮我在以后的日子里过的更好。也确实你很棒,不然你不会有这样的成绩。原创 2023-02-08 17:30:47 · 207 阅读 · 1 评论