![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
Studying Zhou
毕业于南京工业大学 现滴滴任职资深数据仓库开发工程师
展开
-
数据仓库预测分析-软文
数据仓库预测分析转载 2022-08-15 16:05:29 · 129 阅读 · 0 评论 -
Mac Git 学习教程 之 本地项目代码上传到GitHub
https://jingyan.baidu.com/article/636f38bb9747d1d6b84610f3.html转载 2021-03-11 15:39:25 · 72 阅读 · 0 评论 -
数仓分层
https://www.cnblogs.com/shengyang17/p/10545198.html转载 2019-06-14 16:36:46 · 569 阅读 · 0 评论 -
数仓建模
https://blog.csdn.net/zuochang_liu/article/details/81434611转载 2019-04-19 14:52:45 · 455 阅读 · 0 评论 -
数据仓库建设的方法 绝对的好文
原文链接:点击打开链接在上一期的专栏文章中,我们曾经提到:数据分析系统的总体架构分为四个部分 —— 源系统、数据仓库、多维数据库、客户端(图一:pic1.bmp)其中,数据仓库(DW)起到了数据大集中的作用。通过数据抽取,把数据从源系统源源不断地抽取出来,可能每天一次,或者每3个小时一次(当然是自动的)。这个过程,我们称之为ETL过程。那么,今天,我们就来谈一谈:如何搭建数据仓库,在这个过程...转载 2019-04-19 10:35:01 · 773 阅读 · 1 评论 -
详解搭建CDH平台
https://blog.csdn.net/Com_ma/article/details/79967036转载 2019-04-18 10:12:32 · 336 阅读 · 0 评论 -
从零搭建hadoop集群
https://blog.csdn.net/lxbalex/article/details/83188753转载 2019-04-11 17:29:49 · 106 阅读 · 0 评论 -
搭建Hadoop集群,一个月6T的数量需要几台服务器
搭建Hadoop集群,一个月6T的数量需要几台服务器配置几个namenode,几个datanode,namenode和datanode怎么部署,内存与硬盘大小量,看你副本数量设置是多少,一般默认为3,那么仅这些就需要18T硬盘,稍微大一点20T吧;这仅仅是HDFS存储;(这里我说的是一个月的,你数据保存几个月,就乘几倍)如果你集群上面要跑计算,MR计算出来的数据要保存HDFS的,所以,还是要根...转载 2019-04-08 10:35:07 · 2688 阅读 · 0 评论 -
CENTOS 7.5离线安装Cloudera Manager 5和CDH5(5.15.0) 完全教程
https://blog.csdn.net/u013429010/article/details/81744749转载 2019-04-01 19:34:56 · 120 阅读 · 0 评论 -
数据仓库之宽表
宽表:从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题...原创 2019-03-28 10:43:02 · 21881 阅读 · 0 评论 -
大数据之数仓平台设计思路01
https://blog.csdn.net/hxiao1317098/article/details/73623690转载 2019-03-27 18:35:52 · 385 阅读 · 0 评论 -
第三篇:数据仓库系统的实现与使用(含OLAP重点讲解)
https://www.cnblogs.com/muchen/p/5318808.html转载 2019-03-27 18:25:03 · 213 阅读 · 0 评论 -
第一篇:数据仓库概述
http://www.cnblogs.com/muchen/p/5305658.html转载 2019-03-27 18:24:04 · 110 阅读 · 0 评论 -
第二篇:数据仓库与数据集市建模
https://www.cnblogs.com/muchen/p/5310732.html转载 2019-03-27 18:23:20 · 558 阅读 · 0 评论 -
详解大数据数据仓库分层架构
https://blog.csdn.net/m0_37803704/article/details/80600489转载 2019-03-27 18:11:06 · 914 阅读 · 0 评论 -
数据仓库之基础架构
转自:http://blog.csdn.net/zyj8170/article/details/52920021数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包...转载 2019-03-26 13:15:17 · 250 阅读 · 0 评论 -
数据仓库为什么要分层
数据仓库为什么要分层如何分层结合Inmon和Kimball的集线器式和总线式的数据仓库的优点,分层为ODS【-MID】-DW-DM-OLAP/OLAM/appODS层是将OLTP数据通过ETL同步到数据仓库来作为数据仓库最基础的数据来源。在这个过程中,数据经过了一定的清洗,比如字段的统一,脏数据的去除等,但是数据的粒度是不会变化的。ODS层的数据可以只保留一定的时间。MID中间层是采用In...原创 2019-03-25 17:24:08 · 1215 阅读 · 0 评论