YBB保险电话销售公司已经做完了针对20万用户发放赠险产品的工作,想从接受赠险的客户中,找出会在将来购买付费型保险的客户,从而进行电话营销。为此,YYB公司从20万人中随机选取了5万人向其电话推销付费型保险,结果有200名客户购买了付费型保险。要想节约成本,怎么从这15万人中找出购买可能性最高的客户呢?
下面对整个数据挖掘过程进行剖析。
1、业务目标:找出最容易在将来购买保险的人。
2、数据展示:客户编号、客户婚姻状况、性别、出生年月日、拨打该客户电话时间、客户交通工具、常用银行、通话时长
3、数据预处理:
减少度量单位的依赖,数据标准化或规范化(按比例缩放)。
剔除异常值,字符型数值型转化,去重,合并数据集。
4、造变量:制造衍生变量,日期->星期
5、生成挖掘表(训练集):自变量和目标变量(标签):1代表购买保险,0代表没有购买保险。
6、建立响应模型(训练&