![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
db
文章平均质量分 79
shiren1118
http://www.chinagroovy.org/forum/index.php
展开
-
发一个我写的ETL(BI)工具perletl开源项目
BI--商务智能 DW--数据仓库 一定是未来10年的重头戏。我们知道现在企业级应用越来越多,数据量自然越来越大,尤其以电信,银行,erp,电子商务,社交网络等非常明显。以移动为例,每天n个T的话单数据,以校内网为例,它现在成立了一个数据仓库部门,在招人,使用hive数据库,比如做营销的北京新华信,比如淘宝~~~~~~~业界也是,比如teredata公司推出了pb级别的数据仓库,1pb=102...2010-04-13 06:41:47 · 544 阅读 · 0 评论 -
ETL调度原理浅析及最佳实践
ETL 调度原理浅析及最佳实践 前言: 最早的调度应用是 unix 的 crontab 。 最早的 ETL 规范是 NCR 和 SPSS 一起制定的,所以 NCR ETL Automation 的方式此后一直是业界效仿的原因 (SPSS 的 climentine 严格意义上它讲不再是 etl 调度工具,而是数据挖掘工具 ) ...原创 2010-11-17 23:04:58 · 1894 阅读 · 0 评论