python泰坦尼克号生存预测论文_python泰坦尼克号生存预测

本文介绍了使用Python进行泰坦尼克号生存预测的项目,包括数据理解、数据清理、特征工程、模型构建和评估。通过填充缺失值、特征选择,利用逻辑回归模型进行预测,并探讨了特征选择和数据处理对模型准确性的影响。
摘要由CSDN通过智能技术生成

前言笔者在复习统计学回归和分类、学习python逻辑分类回归语言后做了这个入门项目,意在提高笔者运用python分析项目的实际能力。

本文共六节,阅读时间约为15分钟。

思路整理

1、项目理解

1.1了解背景

泰坦尼克号沉船是历史上最有名的沉船事件之一:1912年4月15日,在她的第一次航行中,泰坦尼克号与冰山相撞后沉没。船上乘客和机组人员2224名,其中1502人死亡。这场耸人听闻的悲剧震惊了国际社会,从而出台了更规范船舶安全规定。造成海难失事的原因之一是船上没有足够的救生艇。尽管幸存有部分运气因素,但总有些人比其他人更高概率生存,如妇女、儿童和上流社会者。

项目地址:(含项目介绍、数据下载、数据说明)

1.2明确问题

项目要求是预测一名乘客是否能够幸免于泰坦尼克号沉没。对于测试集中的每个PassengerId,要求为Survived变量预测0或1值。

1.3整理思路

2、理解数据

2.1数据导入

注意用pandas读取文件,文件名带中文会报错:Initializing from file failed。如

res = pd.read_csv('我的文件.csv')

解决方法

f = open('我的文件.csv')res = pd.read_csv(f)

2.2查看数据集信息

多出的一列为Survived,即本项目

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值