数据挖掘
文章平均质量分 81
thinker28754
这个作者很懒,什么都没留下…
展开
-
ETL学习笔记之四:开源项目 Kettle
http://blog.csdn.net/tiger119/archive/2007/01/21/1489062.aspx 现在是一个Google的时代,而对于开发者,开源已成为最重要的参考书。对于某课题,不管你是深入研究还是初窥门径。估且google一把,勾一勾同行的成就,你必会获益良多。 说到ETL开源项目,Kettle当属翘首,因此,偶决定花点时间了解一下。原创 2009-03-10 20:14:00 · 1204 阅读 · 0 评论 -
开源ETL工具kettle系列之常见问题
摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 1. Join我得到A 数据流(不管是基于文件或数据库),A包含field1 , field2 , field3 字段,然后我还有一个B数据流,B包含field4 , field5 , field6 , 我现在想把它们 ‘加’ 起来, 应该怎原创 2009-03-10 19:59:00 · 4352 阅读 · 1 评论 -
数据仓库建模与ETL实践技巧
数据仓库建模与ETL实践技巧北京迈思奇科技有限公司 戴子良专家简历戴子良,北京迈思奇科技有限公司(www.minesage.com)咨询顾问,微软MCP,ETL专家,在数据仓库,数据清洗,数据整合和多维数据库方面有很深的造诣,负责企业级数据仓库建模,ETL,数据仓库实现,调度,海量数据的优化处理以及数据分析与挖掘等。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Mic原创 2009-03-26 15:00:00 · 837 阅读 · 0 评论 -
海量数据处理分析
海量数据处理分析 北京迈思奇科技有限公司 戴子良 笔者在实际工作中,有幸接触到海量的数据处理问题,对其进行处理是一项艰巨而复杂的任务。原因有以下几个方面:一、数据量过大,数据中什么情况都可能存在。如果说有10条数据,那么大不了每条去逐一检查,人为处理,如果有上百条数据,也可以考虑,如果数据上到千万级别,甚至过亿,那不是手工能解决的了,必须通过工具或者程序进行处理,尤其海量原创 2009-03-26 15:05:00 · 988 阅读 · 0 评论 -
BI中的特殊语言——MDX(下)
BI中的特殊语言——MDX(下)作者:戴子良、李苗 在上期文章中,我们针对MDX语言,从简单的语法要素入手,以进阶的方式,介绍MDX从基础到高级的应用,以及MDX与SQL之间显著的区别。本期文章将继续MDX的高级应用话题,为大家介绍MDX更为广泛的使用途径。 在SSIS中使用MDX 在处理ETL时,我们有时需要在E原创 2009-03-26 15:06:00 · 4816 阅读 · 0 评论