心如止水--coofucoo的专栏

We are all fighters, fighting for life and love.

张钦雁ID:coofucoo
538504次访问,排名69好友0人,关注者2
coofucoo的文章
原创 286 篇
翻译 16 篇
转载 238 篇
评论 763 篇
coofucoo zhang的公告
本站说明:
本站为coofucoo的个人blog,
主要用来发表coofucoo个人的文章,
以及收藏经典文章之用。

If you love something very very much... Let it go free!!! If it does not come back... It means it does not belong to you... If it does, Please love it forever!

我得联系方式:
email:39zqy@sina.com
qq:121951686
加我QQ者请说明来历,否则被拒绝别怪我啊。

最近评论
herry0628:USFINE.COM sell World of Warcraft gold and
wow powerleveling sevise.
herry0628:USFINE.COM sell World of Warcraft gold and
wow powerleveling sevise.
herry0628:USFINE.COM sell World of Warcraft gold and
wow powerleveling sevise.
herry0628:USFINE.COM sell World of Warcraft gold and
wow powerleveling sevise.
herry0628:USFINE.COM sell World of Warcraft gold and
wow powerleveling sevise.
文章分类
收藏
相册
Fun
LEYOU工作室
Live
NBA
WOW
Yourzine
个人收藏
工作show
南京之行
我的济南,我的学校
我在天津
英业达06之旅
LEYOU工作室作品
山东建筑工程学院管理工程系网站
本人收藏
CityLife的流水账
fatalerror99 (iTePub's Nirvana) 的专栏(RSS)
leeseon的blog
Mirricle blog
勤奇殊话
宋姐的blog
阳阳的blog(RSS)
翻译计划
个人关注
20年:海尔教科书
ajaxpatterns
artima.com
C/C++ Reference
earthwebnews.com
Joel on Software
oops
slashdot.org
theserverside.com
wiki
世界经理人网站
哈佛商业评论
搜狐理财
梦想风暴
环球企业家
存档
软件项目交易
订阅我的博客
XML聚合  FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
订阅到BlogLines
订阅到Yahoo
订阅到GouGou
订阅到飞鸽
订阅到Rojo
订阅到newsgator
订阅到netvibes

转载 ETL学习笔记之一:ETL是什么?收藏

新一篇: ETL学习笔记之二:ETL与BI  | 旧一篇: OLAP MDX 学习笔记

http://blog.csdn.net/tiger119/archive/2007/01/14/1482555.aspx

对于数据仓库以及ETL的知识,我基本上是个门外汉。一切都得从头开始,记个笔记,方便自已了解学习进度。
   
    首先,我们来了解最基本的定义:
    嗯,也有人将ETL简单称为数据抽取。至少在未学习之前,领导告诉我的是,你需要做一个数据抽取的工具。
    其实呢,抽取是ETL中的关键环节,顾名思义,也就将数据从不同的数据源中抓取(复制)出来。
    太简单了!
    上面的解释无首无尾,有点象能让你吃饱的第七个烧饼,
    仔细一想,抽取是不可能单独存在,我们需要将与之关联的一些其它环节拿出来。

    于是,得到ETL的定义:
    将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。
    好的,既然到了这一个层次,我们完全会进一步展开联想,引出上面这个抽象事件的前因后果,

    抽取的源在哪里?
    装载的目的又是什么呢?

    抽取源:大多数情况下,可以认为是关系数据库,专业一点,就是事务处理系统(OLTP)。当然,广义一点,可能会是其它数据库或者是文件系统。
    目的地:OK,我们希望是数据仓库。数据仓库是啥?在学习之前,它对我来说是个抽象的怪物,看过一些简单的资料之后,才了解这个怪物一点都不怪。堆积用来分析的数据的仓库。是了,是用来分析的,于是,它区别于OLTP中的数据存储。

    然后,我们来看看为什么要ETL?
    在我看来,有两个原因。
    一:性能  将需要分析的数据从OLTP中抽离出来,使分析和事务处理不冲突。咦?这不是数据仓库的效果吗?是了,
数据仓库,大多数情况下,也就是通过ETL工具来生成地。
    二:控制  用户可以完全控制从OLTP中抽离出来的数据,拥有了数据,也就拥有了一切。
    嗯,OLAP分析,数据挖掘等等等……。

    最后,总结一下,
    从资料上看,ETL是一门大学问,对于大学问,实在有些怕怕,所以,我觉得应该停下来想一想,下一步我该干点啥?
    嗯,时不我待,我没有办法一切从头开始,
    是了,从应用出发,看看现在工作中,最急需的是什么?

    鸭子要变成一盘菜,并不是举手将之置于油锅之劳。
    OK,要将生米变为熟饭,鸭子放上大盘,一堆废话之后,我得先看看厨房里都有了一些啥? 

发表于 @ 2007年11月08日 18:20:00|评论(loading...)|编辑

新一篇: ETL学习笔记之二:ETL与BI  | 旧一篇: OLAP MDX 学习笔记

评论

#godswhisper 发表于2008-03-02 16:29:48  IP: 222.30.21.*
最近毕设在做相关的东西...还没学会做这盘菜,学习中...
发表评论  


当前用户设置只有注册用户才能发表评论。如果你没有登录,请点击登录
Csdn Blog version 3.1a
Copyright © coofucoo zhang