CRISP-DM

CRISP-DM是跨行业标准数据挖掘流程,包括理解项目、理解数据、数据准备、建模、评估和部署六个阶段。数据科学家通过与业务部门沟通明确目标,分析数据质量,处理异常值,构建模型,评估模型性能,并最终部署到业务环境中。在实际操作中,建模和数据准备可能需要反复迭代以确保模型效果。
摘要由CSDN通过智能技术生成

“跨行业标准数据挖掘流程”(Cross Industry Standard Process for Data Mining ,CRISP-DM)
CRIPSP-DM流程图
1. 理解项目
数据科学家试图通过了解业务需求来定义项目的目标。在项目的早期阶段,在项目的这个阶段,数据科学家将花费大量时间与业务部门(例如,销售、营销、运营部门)的同事面谈以了解业务问题。
2. 理解数据
这个阶段,需要分析数据。检查数据的质量,相关性等,处理缺省值,outlier,检查数据的格式,不同特征值间的独立性。
3. 数据准备
数据准备阶段的重点是创建可用于数据分析的数据集。
通常,创建此数据集涉及集成来自多个数据库的数据源,当组织机构具有数据仓库时,这种数据集成相对简单。
创建数据集后,需要检查数据质量并修复有问题的数据,通常需要处理缺失值,异常值,选择特征值,完整数据转化,提高数据质量。
4. 建模
在建模阶段,数据科学家通常会在数据集上使用多种机器学习算法并训练出多个模型。此时通过在数据集上运行机器学习算法来训练模型,以识别数据中的有用模式。
在大多数数据科学项目中,初始模型的测试结果就能揭示数据中的问题。当数据科学家发现模型的性能低于预期或模型的性能达到预期但真实性存疑时,数据错误有时会暴露出来。或者通过检查模型的结构,数据

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值