基于Python随机森林案例:给别人的爱情把关

数据分析师小C帮助表妹小Q预测Mr.Z的收入,以判断是否符合5w以上的择偶标准。小C使用成年人数据集,经过数据预处理、随机森林模型训练,得出模型预测准确率为80%。最终模型显示Mr.Z的收入不符合小Q的要求。
摘要由CSDN通过智能技术生成

我们都知道爱情不仅要有爱你之心,还有柴米油盐,最好的爱情不是风花雪月,而是雪中送炭,如果有一天爱情你都不相信了。不知道你接下来的日子该往哪里走,一定要相信你身边那个数据分析师的朋友,他会用数据告诉你的爱情之路怎么走?

1.案例背景

案例背景

某天,小C的表妹小Q来找小C,说他遇到一点困扰----小Q的同事给她介绍了一个对象Mr.Z,这个人现年37岁,在某省机关做文员工作,但是小Q的择偶标准是需要对方月薪在5w以上,不要说小Q拜金,只因世人都知软饭香,但是现在刚认识没多久,也就不好意思直接问Mr.z,所以拿不动主意要不要和Mr.z深入交往,(说白了就是不知道Mr.z到底有多少钱?),于是想让小C帮忙做一个决策,作为优秀的大数据分析师的小C,小C思忖良久,发现此事并不简单,还需要用到python,还需要搭建模型,于是小C一下子想到了决策树算法,通过联想,又想到了随机森林,灵光乍现,突然想起来一个好主意,于是他就开始了。。。。

数据集的准备

大家都知道一个著名的数据集-成年人数据集,包括千万条样本数据,样本数据中一般包括年龄,工作性质,统计权重,学历,受教育时长,婚姻状况,职业,家庭教育,种族,性别,资产所得,资产损失,每周工作时长,原籍,收入等,这个数据集应该有用,于是先下载看看。
下载链接:
源数据点击下载
在这里插入图片描述
下载完直接重命名为adult.csv,本来后缀是data,直接删掉,强行改为csv格式文档。
在这里插入图片描述

3.读取数据

import pandas as pd
data = pd.read_csv('D:\\Python\\adult.csv',header = None,index_col = False,
                  names = ['年龄','单位性质','权重','学历','受教育时长','婚姻状况','职业',
                           '家庭教育','种族','性别',
                           '资产所得','资产损失'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鹏鹏写代码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值