![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 90
HanseyLee
这个作者很懒,什么都没留下…
展开
-
fast note
note原创 2022-09-22 23:23:30 · 168 阅读 · 1 评论 -
一种基于SparkSQL的Hive数据仓库拉链表缓慢变化维(SCD2+SCD1)的示例实现
背景Hive 实现缓慢变化维,没有使用事务表的更新和删除操作(最新版本Hive已经支持,但需要Server/Client做相应配置,Hive实现的事务还有一定的局限性)Hive 自身的SQL使用MapReduce引擎,速度慢,这里使用SparkSQL实现参考:准备基础维度表 base_dim业务字段:id, name, city, st维度表默认字段:sk, scd_upd...原创 2019-08-06 16:43:12 · 1741 阅读 · 0 评论