一般数据挖掘流程

本文详细介绍了数据挖掘的全过程,从理解业务需求开始,包括挖掘流程、基础数据分析、数据处理(异常值与缺失值处理、特征工程)、模型搭建、模型评估到最终的模型部署。在数据处理环节,讨论了异常值的多种判断与处理方法,以及缺失值的填充策略。特征工程中涉及定性与定量特征的处理、特征选择和降维。模型评估则关注KS、ROC曲线和AUC等指标。
摘要由CSDN通过智能技术生成

1.业务需求

2.挖掘流程

3.基础数据分析

4.数据处理

5.模型搭建

6.模型评估

7.模型部署

1.业务需求

在理解业务背景、含义、目标的前提下将需求转化为数据挖掘问题的定义和完成目标的初步计划, 按照业务需求配合整理数据维度与口径,在此基础上进行数据统计。最初阶段集中理解业务需求和数据分析。

2.挖掘流程

 

3.基础数据分析

基本分析方法:数据分布、数据对比、数据象限、数据相关性、数据辨别分析、数据结构化拆分等;

统计基本信息:最大最小值、中位数、分位数、均值等;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值