E家数据挖掘计划书_按照crisp-dm规划

E家数据挖掘计划书

一、商业理解(11.24)

1.确定数据挖掘目标

建立e家客户响应规则集;

2.数据挖掘成功标准

用规则集来评价新增用户,或是其他非e家客户,耦合程度大的定义为潜在e家用户,对其实行针对性营销的成功概率希望为15%以上。

3.工具技术

数据挖掘工具SPSS_clementine

4.制定项目计划

二、数据理解(11.25-11.26)

1.原始数据收集

输出:获得要列入数据挖掘项目资源的数据,客户基本信息表,客户费用基本信息表,产品基本信息表的数据,以及必要的数据加载和导入方式;

2.数据描述

输出:描述数据格式和数据质量给出结果报告,包括表的记录总数,字段数,字段的标识

3.数据探索

对字段的初步发现和理解以及对后续阶段的影响;

4.数据质量

数据的完整性,数据正确性,有无缺省值

三、数据准备(11.27-11.28)

3.1数据选择 与数据挖掘目标的相关性,被包含进来的字段和被排除的字段和理由;

3.2数据清洗 保证数据质量 :缺失值的插入,通过建模评估缺省值

3.3构造数据 关于衍生字段的属性确定问题(可选)

3.4整合数据 对象:客户基本信息表,客户费用基本信息表,产品基本信息表的的整合

输出:数据集,该数据集含有完整的需要挖掘的字段以及记录,数据类型确定,完整性好,可以直接提供给数据挖掘工具进行分析;

四、建模(12.1-12.5)

4.1选择建模技术:C5决策树;

4.2生成测试设计 :设置数据抽样,将其分为训练数据和检验数据,检验数据用于后期的模型评估;

4.3建立模型 

输出:

参数设置,对应字段需要调整的参数和设置值,选择这些参数的基本原则;

模型:生成的实际模型;

模型描述:对模型中生成的规则集进行描述和总结;

模型评估:用检验数据来进行检验,评估模型的准确率;

五、评价

评价:模型适合商业目标的程度

 

 

注:改计划书以CRISP-DM数据挖掘标准流程为指导。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值