1、项目背景
以银行经典营销数据集(营销场景是通过电话方式给客户推荐定期存款业务)作为分析样本,对用户特征、银行存款贷款业务、营销活动等信息进行分析,目的是充分挖掘客户的需求、刻画客户群体肖像,以便制定银行营销策略,从而推动银行业务的开展。
2、数据详情及清洗
2.1 数据量
数据集共包含有11162条数据,17个字段信息,即11162行*17列。
2.2 数据理解
字段名 | 含义 |
age | 客户年龄(数值) |
job | 客户职业(分类:admin, bluecollar, entrepreneur, housemaid, management, retired, self-employed, services,student, technician, unemployed, unknown) |
marital | 客户婚姻状况(分类:divorced, married, single, unknown) |
education | 客户学历情况(分类:primary, secondary, tertiary and unknown) |
default | 客户失信状况(分类:yes, no) |
balance | 客户资产余额(数值) |
housing | 客户房屋贷款情况(分类:yes, no, unknown) |
loan | 客户个人贷款(分类:yes, no, unknown) |
contact | 联系客户的方式(分类:cellular, telephone) |
day | 最后一次电话营销的日期(数值:月份中的哪一天) |
month | 最后一次电话营销的月份(分类:jan, feb, mar, apr,…,nov, dev) |
duration | 与客户通话时长(数值:以秒为单位,0的话最终输出结果必然是0) |
campaign | 联系客户次数(数值:此活动中联系该客户的次数) |
pdays | 距上次联系完客户后的天数(数值:999代表未联系过该客户) |
previous | 这次活动前与这位客户联系的次数(数值) |
poutcome | 上次营销的结果(分类:yes, no, unknown) |
deposit | 定期存款(分类:yes, no)客户是否已购买定期存款 |
2.3 数据清洗
1.经查找本数据集无重复值、无缺失值,所以均为无需处理
2.job列中包含异常值‘admin.’,将字段统一替换为‘admin’