数据仓库
ttdata
如果半途而废,就意味着从头来过
展开
-
浅谈数据仓库建设中的数据建模方法
周三保(zhousb@cn.ibm.com) IBM 软件部信息技术专家.简介: 本文的主要内容不是介绍现有的比较流行的主要行业的一些数据模型,而是将笔者在数据仓库建设项目中的一些经验,在这里分享给大家。希望帮助大家在数据仓库项目建设中总结出一套能够合乎目前业界规范的,满足大部分行业数据仓库建设标准的一种方法。所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看转载 2017-08-08 11:49:21 · 372 阅读 · 0 评论 -
EA-企业架构
在《年度总结和计划:去年4个1,今年5个1》中说过今年我准备在项目组引入一个架构方TOGAF。工业和信息化部副部长杨学山在一次内部座谈时提到:与西方发达国家比,国内的信息化建设在硬件方面已经不相上下,在软件方面有5年的差距,在信息化管理方面有大概10年的差距,在企业架构方面则有20年的差距。而企业架构离不开我们IT技术领域的架构师的支持,为了让更多人了解企业架构,我将会写一系列相关的blog与大家转载 2017-08-12 06:28:20 · 12071 阅读 · 1 评论 -
数据仓库建模参考
https://wenku.baidu.com/view/b6bd5ccb4028915f804dc294.html宽表的思考一 宽表的优点1. 宽表浅意上的好处在当前这个项目中,大量使用了宽表,字段超过一百五十个字段的宽表有五张,分别是客户机构级信息表、客户客户经理级信息表、客户经理信息表、集团客户信息表、战略客户信息表。从上面的表名转载 2017-09-04 10:04:36 · 2264 阅读 · 0 评论 -
阿里的数仓
干货:解码OneData,阿里的数仓之路标签: 数据仓库架构2017-04-26 10:53 249人阅读 评论(0) 收藏 举报 分类:工作(47) 目录(?)[+]摘要: 据IDC报告,预计到2020年全球数据总量将超过40ZB(相当于4万亿GB),这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大转载 2017-08-31 19:26:45 · 4112 阅读 · 0 评论 -
数据仓库-模型
Technorati 标签: 数据仓库,模型设计数据仓库的模型设计A. 数据建模方法论数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。模型设计分为三个阶段:1,概念模型对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。一般划分为8个主题域:客户、服务、服务使用、账务、结算、资源、客服、营销为什么要划分主题域?转载 2017-08-31 19:38:52 · 1679 阅读 · 0 评论 -
解耦-大宽表
数据仓库应用中,宽表模型以结构简单,模型容易理解,数据访问效率等优势,被业界广泛采用。所谓宽表就是,基于某个实体分析对象而建立的一个逻辑数据体系,由实体的维度、描述信息、以及基于这个实体一系列度量组成。它是一个逻辑的概念,在物理实现中不可能就针对一个实体对象建立一个大宽表。因为这样,对于,刷新效率,容错能力,扩展能力都是一个很大的挑战,如何设计和组织宽表的体系结构呢?其实,我们回到软件设计转载 2017-08-31 19:42:12 · 7473 阅读 · 5 评论 -
数据仓库-架构参考
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用: 从图中可以看出数据仓库的转载 2017-09-01 09:51:06 · 793 阅读 · 0 评论 -
用户画像-方法
为了让团队成员在研发过程中能够抛开个人喜好,将焦点关注在目标用户的动机和行为上,Alan Cooper提出了Persona这一概念。“赢在用户”这本书将其翻译为“人物角色”,在腾讯我们习惯了使用“用户画像”这个术语。表达的意思一样,是真实用户的虚拟代表,是在深刻理解真实数据的基础上得出的一个的虚拟用户。我们通过调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中转载 2017-09-01 10:17:37 · 1544 阅读 · 0 评论 -
数据仓库的架构-参考
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用: 从图中可以看出数据仓库的转载 2017-09-01 14:50:11 · 1049 阅读 · 0 评论