Python机器学习入门1.7《使用决策树模型预测泰坦尼克号乘客的生还情况》

这篇博客介绍了如何利用Python的决策树模型预测泰坦尼克号乘客的生还情况。首先,通过pandas对数据进行预处理和统计分析,然后进行特征选择和数据分割。接着,将数据转换为适合模型训练的格式,并训练决策树模型。最后,评估模型的性能,强调了决策树模型的直观性和可解释性。
摘要由CSDN通过智能技术生成

泰坦尼克号乘客数据查验:


#导入panadas用于数据分析
import pandas as pd
#利用pandas的read_csv模块直接从互联网读入数据
titanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')
#观察前几条数据,可以发现,数据种类各异,数值型、类别性,甚至还有缺失数据
#print(titanic.head())

使用pandas,数据都传入独有的dataframe格式(二维数据表格),直接使用info(),查看数据的统计特性 :

titanic.info()

特征选择

X=titanic[['pclass','age','sex']]
y=titanic['survived']
#对当前选择的特征进行探查
#X.info()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江湖无为

感谢你们的鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值