![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 78
学而知之@
学而知之
展开
-
基于DolphinScheduler的使用浅谈数仓分层及模型设计
前言:本文旨在简单介绍DS的概述和架构上的设计,对其安装等不做展开介绍。之前了解了一下,很多小伙伴也在使用该产品。我呢,也是到现在公司后才开始接触并使用,对其 “开发” 的还不够深,这里根据官方文档和项目中的实践和大家简单分享。欢迎大家批评指正,敬礼!一、简介DS是分布式易扩展的可视化工作流任务调度平台。Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。二、架构原创 2021-08-14 00:15:18 · 7562 阅读 · 0 评论 -
数据仓库之扫盲篇(一)
一、前言本文核心点:了解互联网仓库是做什么的,数仓生态体系,数仓人员接触的产品。二、主要内容2.1、什么是数据仓库数据仓库是一种理论知识,通过数仓理论知识结合不同的业务体系而构建的数据生命体系,数据生命体系构建于整个数据平台体系之上业务体系之下。2.2 、公司为什么搭建数据仓库首先当一个公司业务体系可以实现商业化变现,需要通过数据来精细化运营,通过数据科学来指导商业决策,需要一套敏捷的数据来决策公司的业务策略,而数据仓库是整个公司体系的中间层,上对接产品分析,下对接平台开发,左对接业财一体,右对原创 2021-05-24 23:56:06 · 348 阅读 · 7 评论