机器学习回归之商品x的网络消费购买预测实例(sklearn)包含数据集的训练与预测

这篇博客通过sklearn库对6000行训练数据进行机器学习,预测用户是否购买商品X。数据包括用户的社会人口信息和消费行为,目标特征为PURCHASE。测试数据集包含3822行,需返回预测购买概率。评价标准为AUC。
摘要由CSDN通过智能技术生成

请预测谁会购买商品X,并描述过程分析原因

此次大作业如题即:根用户的一些信息(包括,性别、年龄、经济状况、消费行为等),对其是否购买商品X进行预测。
注意:
1 论文的打印版(两个文档)都需要提交(《论文首页》不要装订,《报告》左侧装订),提交地点请见网站
2 注意不要尝试考验老师分析你是否有copy嫌疑的能力,如果两个同学,被证明有copy嫌疑,两个人的最终成绩都会是59.99分。

2 数据介绍
下面详细介绍数据(6-数据集 文件夹中)及需要的结果集:

Train.csv 6000行, 86列, 最后一列为用户是否购买过商品X的状态: 1-为购买 0-为没有购买
Test.csv 3822行, 85列

相关文件:

Train.csv:
用于训练和构建预测模型的数据集(6000条消费者记录)。每条记录包含了86个特征,包括了社会人口数据(特征1-43)和拥有商品情况(特征44-86)。社会人口特征由邮政编码得到。所有生活在邮政编码相同地区的消费者拥有相同的社会人口特征。特征86(PURCHASE)是目标特征。

Test.csv:
用于测试的数据集(3800条消费者记录)。除了目标特征缺失以外,数据集与Train.csv拥有相同格式。你应当只返回包含对目标特征预测的列表。所有数据集均为制表符分隔文本。

各个特征的含义和特征值如下:

数值 特证名 描述 取值
1 CUSTYPE 消费者类型 L0
2 NUMHOUSE 房屋数量 1-10
3 AVGHOUHO 家庭规模 1-6
4 AVGAGE 平均年龄 L1
5 CUSMAITY 消费者大类 L2
以下为每个邮政编码下的比例,取值见L3
6 MRELIRK 天主教徒 L3
7 MRELIPK 新教徒 L3
8 MRELIOV 其他宗教 L3
9 MRELIGE 无宗教信仰 L3
10 MMARGE 已婚 L3
11 MMARSA 同居 L3
12 MMAROR 其他感情关系 L3
13 MFSING 单身 L3
14 MFWOKD 家庭没有小孩 L3
15 MFWIKD 家庭有小孩 L3
16 MEHIGH 高教育水平 L3
17 MEMIDD 中等教育水平 L3
18 MELOWE 低等教育水平 L3
19 MBHIST 高社会地位 L3
20 MBENTR 企业家 L3
21 MBFARM 农民 L3
22 MBMIMA 中等管理人员 L3
23 MBSKLA 有技能的工人 L3
24 MBUSLA 没有技能的工人 L3
25 MSCA 社会等级A L3
26 MSCB1 社会等级B1 L3
27 MSCB2 社会等级B2 L3
28 MSCC 社会等级C L3
29 MSCD 社会等级D L3
30 MHRENT 租房住 L3
31 MHOWNE 拥有房屋 L3
32 MCAR1 有一辆车 L3
33 MCAR2 有两辆车 L3
34 MCAR0 没有车 L3
35 MHSFOND 公立医疗服务 L3
36 MHSPRIV 商业医疗保险 L3
37 MINCO30 收入<30,000 L3
38 MINC3045 30,000<收入<45,000 L3
39 MINC4575 45,000<收入<75,000 L3
40 MINC7512 75,000<收入<122,000 L3
41 MINCO123 收入>123,000 L3
42 MAVEIN 平均收入 L3
43 MPURKL 购买力级别 L3
以下为每个邮编内的该变量的总数,取值见L

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值