数据挖掘的流程

数据挖掘涉及商业理解、数据理解、数据准备、建立模型、模型评估和模型实施等步骤。这一过程旨在从大量数据中提取有用信息,通过工具如SPSS和SAS进行建模与评估。知识发现阶段包括数据清理、集成、选择、变换和挖掘,最终形成可评估和可视化的知识模式。
摘要由CSDN通过智能技术生成

数据挖掘的流程

1、 数据挖掘的定义: 数据挖掘是从大量的,不完全的,随机的,模糊的,有噪声的实际应用数据中,提取隐含在其中,但又有潜在有用的信息和知识的过程。
2、跨行业数据挖掘的标准流程是当今数据挖掘界通用的流行标准之一,基本步骤为:
商业理解:从商业的角度理解项目的目标的要求,转化为数据挖掘问题,确定业务目标,项目可行性分析,确定数据挖掘的目标,提出项目计划。

数据理解:收集原始数据,熟悉数据,了解关键属性的分布,检查数据是否完整。

数据准备:数据选择,数据清洗,数据创建,数据合成,数据转换。填充缺失数据,转换为合适的格式

建立模型:选择建模技术,测试方案的设计,模型训练,模型测试评估。

模型评估:为确保它真正的达到商业目标,对结果进行评估,检查建立模型的各个步骤,进行过程回顾,,确定下一步的工作,重新建模,还是部署该模型。

模型实施:实施计划,监控和维护,做出最终的报告,回顾项目,总结经验。
3、以上是流程,还有SPSS和SAS 两种工具,算作两种模型:SPSS模型有两个重要的箭头在模型评估的过程后,会比较商业理解,看能否达到商业目标,也会在实施之后比较商业理解,看是否符合商业目标
SAS提出
取样 预处理 技术选择 特征处理 建模 评估。
4、数据挖掘又称为数据库中的知识发现,实际上是知识发现的一个基本步骤:
知识发现的过程:
数据清理; 消除噪声数据,填充缺失值,删除不一致的数据

数据集成:将多种数据源组合在一起

数据选择:从数据库中提取分析相关的数据

数据变换:通过汇总和聚集操作,把数据变换和统一成适合挖掘的形式

数据挖掘:基本步骤,使用智能的算法提取数据模式

模型评估:根据某种兴趣度度量,识别表示知识的真正有趣的模式

知识表示:使用可视化和知识表示技术向用户提供数据挖掘知识 使用可视化技术向用户展示。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值