
数据仓库
文章平均质量分 81
木东居士
数据搬运工一只,欢迎光临个人小站:http://www.mdjs.info/about/
展开
-
一种通用的数据仓库分层方法
0x00 概述数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明,或缺少可落地实施的方案,或缺少具体的示例说明。因此,本文将指出一种通用的数据仓库分层方法,具体包含如下内容: 介绍数据分层的作用 提出一种通用的数据分层设计,以及分层设计的原则...原创 2018-12-27 17:31:21 · 8012 阅读 · 9 评论 -
漫谈数据仓库和范式
0x00 概述长期从事数据仓库的你,是否还记得数据库设计中的三大范式?在设计数据仓库的表时,是否考虑过规范化和反规范化之间的区别?是否想过数据仓库和数据库在设计中对范式考虑的侧重点是什么?本文,将包含如下几个方面: 一起回顾数据库设计中经典的三大范式 聊一聊数据仓库和范式之间的关系 聊一聊数据仓库和数据库在范式设计中的侧重点 全文将会围绕一个订单表(假设一个订...原创 2018-12-27 17:33:29 · 2056 阅读 · 0 评论 -
数据仓库实践之业务数据矩阵的设计
怀疑有如草木之芽,从真理之根萌生...0x00 概述数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。本文将包含如下三部分内容:分享业务数据仓库的概念的作用 举个栗子说明 一些思考0x01 业务...原创 2019-01-01 11:40:52 · 3999 阅读 · 1 评论 -
闲聊数据库和数据仓库的区别
0x00 前言最近群里童鞋们在数据库和数据仓库的区别,因此简单做一些整理。0x01 概念上的区别数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。 ————百度百科数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战...原创 2019-03-10 22:28:36 · 1094 阅读 · 0 评论 -
数据质量监控:如何让老板相信你的数据?
0x00 概述随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。**而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基础,也是这一切的数据驱动决策的前提!**如何保障数据质量,确保数据可用性是每一位数据人都不可忽略的重要环节。数据质量,主要从四个方面进行评估,即完整性、准确性、一致性和及时性,本文将会结合业务流程和数据处理流程,对...原创 2019-04-15 22:00:30 · 4024 阅读 · 0 评论 -
如何优雅地启动一个数据项目!
数据团队思考:如何优雅地启动一个数据项目! 0x00 前言 你是否遇到马上要启动了一个新的数据项目了,却不知道如何下手准备? 你是否在和老板汇报项目计划时,还只知道开篇就列项目方案? 你是否在做项目规划时,自己脑海里还没能形成一条完整的主线? 如果,上面的问题,你有遇到! 那么,我们就可以开启本篇文章的主题:如何优雅地启动一个数据项目! ...原创 2019-08-24 15:53:42 · 618 阅读 · 0 评论 -
数据人的通用技能要求
数据团队思考:数据人的通用技能要求 0x00 前言 最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据人该具备哪些通用的技能。 “数据开发到底用不用学算法?” “Excel 有必要学吗?” “数据产品经理需要了解技术吗?” 技能分为两部分:工具和知识。工具包括Excel、Sql 和 Python,知识包括大数据、统计学和机器学习相关知识。 ...原创 2019-08-24 16:09:56 · 843 阅读 · 0 评论