实例：泰坦尼克号幸存者的预测

最新推荐文章于 2024-04-03 17:49:28 发布

l_sun_08

最新推荐文章于 2024-04-03 17:49:28 发布

阅读量1.6k

点赞数 1

文章标签：数据分析案例幸存者预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l_sun_08/article/details/102152331

版权

泰坦尼克号的沉没是世界上最严重的海难事故之一，今天我们通过分类树模型来预测一下哪些人可能成为幸存者。数据集来着https://www.kaggle.com/c/titanic，数据集会随着代码一起提供给大家，大家可以在下载页面拿到，或者到群中询问。数据集包含两个csv格式文件，data为我们接下来要使用的数据，test为kaggle提供的测试集。

导入所需要的库
导入数据集，探索数据
相关变量分析
*查看存活率
*单变量之间的分析
*多变量之间的分析
*缺失值的填充
*相关检验
对数据集进行不涉及到训练集和测试集之间相互影响的预处理（分箱）
提取标签和特征矩阵，分测试集和训练集
导入模型
观察模型的拟合状况
调参数（我们这里用网格格搜索调整参数）
评估模型，ROC曲线
具体代码如下：https://nbviewer.jupyter.org/github/xiaotaiyang08/123/blob/master/练习案例泰坦尼克.ipynb

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
实例：泰坦尼克号幸存者的预测

泰坦尼克号的沉没是世界上最严重的海难事故之一，今天我们通过分类树模型来预测一下哪些⼈可能成为幸存者。数据集来着https://www.kaggle.com/c/titanic，数据集会随着代码一起提供给大家，大家可以在下载页面拿到，或者到群中询问。数据集包含两个csv格式文件，data为我们接下来要使用的数据，test为kaggle提供的测试集。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。