ETL
文章平均质量分 92
大数据丝路
数据仓库工程师,CRM
展开
-
ETL流程概述及常用实现方法
ETL是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。常见于数据仓库开发中将数据由业务系统归集到数据仓库(DW)或者数据集市的过程。在ETL三个部分中,花费时间最长的是“T”(Transform,清洗、转换)的部分,一般情况下这部分工作量是整个ETL的2/3。原创 2015-09-05 13:01:52 · 41694 阅读 · 0 评论 -
海量数据处理的SQL性能优化
介绍了在数据仓库中进行海量数据处理的性能优化常用思路,包括设计阶段的优化: 表设计的方式、索引原理和选择原则、分区键原理和选择原则;还有执行阶段的优化:语句原则、匹配条件的原则、关联的几种方法和优劣、执行顺序方面的优化。原创 2015-09-13 12:25:47 · 3583 阅读 · 0 评论