数据仓库
sxzshushu
Never-ending success
learning is never-ending
展开
-
各大公司的大数据质量监控平台
在这个信息化时代,你用手机打开微信聊天、打开京东app浏览商品、访问百度搜索、甚至某些app给你推送的信息流等等,数据无时无刻不在产生。数据,已经成为互联网企业非常依赖的新型重要资产。数据质量的好坏直接关系到信息的精准度,也影响到企业的生存和竞争力。Michael Hammer(《Reengineering the Corporation》一书的作者)曾说过,看起来不起眼的数据质量问题,实际上是拆散业务流程的重要标志。 数据质量管理是测度、提高和验证质量,以及整合组织数据的方法等一套处理准则,而体量大、转载 2020-08-04 15:21:31 · 1787 阅读 · 0 评论 -
【数仓】数据仓库的建设(二)
前言:前文说了一些数据仓库的基础概念和模型,本文继续往下说吧!【数仓】数据仓库的思考(一):https://blog.csdn.net/lsr40/article/details/1055760471、数仓的目标(能完成什么事情)当工作中遇到以下的事情:-1.数据分层混乱,不知道从何查起-2.数据指标维度不统一,业务/数据分析部门要数据,只能找数据开发口口相传-2.数据建设缺乏规范,表结构字段定义不统一,字段含义模糊,数据任务、数据表维护成本高。-3.重复计算同一个数据.转载 2020-08-01 09:18:44 · 292 阅读 · 0 评论 -
【数仓】数据仓库的思考(一)
前言:对于数仓的概念非常大非常广泛,而且也并没有绝对正确的架构,只是有一定的方法论,一定的前人总结留下来的理论,所以我也不知道我这个系列会更多久,会更多少,反正我就把我现在对于数仓的想法记录下来,以后如果有更深的理解,再说吧~1、什么是数据仓库这个百度也能找到答案,但是我想说的是我的观点。数仓应该是一种数据整合,数据治理,将数据做成一种服务,对外提供。什么叫数据整合,大家应该听过数据孤岛/烟囱这个概念,大概意思就是说:一家公司,数据开发各做各的,数据相互之间不能打通,数据情况掌握在不同.转载 2020-08-01 09:17:52 · 342 阅读 · 0 评论