![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
BigDate
文章平均质量分 95
Charles Zhai
大数据,数据分析,人工智能
展开
-
MapReduce Input Split(输入分/切片)详解--比较容易理解
转自:https://blog.csdn.net/Dr_Guo/article/details/51150278看了很多博客,感觉没有一个说的很清楚,所以我来整理一下。先看一下这个图输入分片(Input Split):在进行map计算之前,mapreduce会根据输入文件计算输入分片(input split),每个输入分片(input split)针对一个map任务,输入分片(input spli...转载 2018-04-25 10:00:46 · 14778 阅读 · 0 评论 -
ETL方法与过程讲解(转)
转自:https://blog.csdn.net/bcqtt/article/details/517577251 ETL基本概念和术语1.1 ETLExtract-Transform-Load的缩写,数据抽取(Extract)、转换(Transform)、装载(Load)的过程。1.2 DWDataWarehousing,根据Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时...转载 2018-05-14 23:36:26 · 25889 阅读 · 1 评论 -
ODS(Operational Data Store)定义
ODS(Operational Data Store)可操作的数据存储。 很多人对ODS究竟是什么有很多的困惑,ODS对于不同的人可以有不同的看法,我主要说说什么是最主流的定义。首先我们需要注意,ODS不同于数据仓库(Data warehouse)或数据集市(Data mart)。数据仓库是用来保存公司来自很多不同的来源的历史数据,并主要将这些数据用于趋势分析,生成报表的地方。它是一个公司很多主...转载 2018-05-15 18:40:48 · 1161 阅读 · 0 评论