概述:
数据集是基于开源数据集Bank Marketing Data Set 的分类预测,本数据集与葡萄牙银行机构的营销活动相关。
这些营销活动一般以电话为基础,银行的客服人员至少联系客户一次,以确认客户是否有意愿购买该银行的产品(定期存款),最终目标是预测客户是否会订购定存业务(变量y)。
数据说明
下载下来的数据是这样的,虽说是csv格式但是并非逗号分隔符,需要通过文本工具打开进行一下替换。
替换后打开结果:
以上表格字段说明,
序号 | 字段名 | 数据类型 | 描述 |
---|---|---|---|
1 | age | Int | 客户年龄 |
2 | job | String | 客户的职业 |
3 | marital | String | 婚姻状况 |
4 | education | String | 受教育水平 |
5 | default | String | 是否有违约记录 |
6 | balance | Int | 每年账户的平均余额 |
7 | housing | String | 是否有住房贷款 |
8 | loan | String | 是否有个人贷款 |
9 | contact | String | 与客户联系的沟通方式 |
10 | day | Int | 最后一次联系的时间(几号) |
11 | month | String | 最后一次联系的时间(月份) |
12 | duration | Int | 最后一次联系的交流时长 |
13 | campaign | Int | 在本次活动中,与该客户交流过的次数 |
14 | pdays | Int | 距离上次活动 |