Data Mining
技术角度的定义
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
商业角度的定义
数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
Data Mining Methods
聚类分析
关联分析
预测建模
异常检测
Most likely to produce results in Data Mining
Too complex results
Find common sense
BI System Architecture
Step1, OLTP (On-Line Transaction Processing) 联机事务处理、Unstructured data、Metadata
Step2, ETL (Extraction Transformation Loading) 数据提取、转换和加载
Step3, Data Warehouse 数据仓库
Step4, OLAP (On-Line Analytical Processing) 联机分析处理、Ad hoc、Report
Step5, Data Mining数据挖掘