泰坦尼克号乘客生存预测中

最新推荐文章于 2025-05-11 14:14:42 发布

我今天ac了吗

最新推荐文章于 2025-05-11 14:14:42 发布

阅读量957

点赞数 32

分类专栏：数据挖掘与机器学习文章标签：数据挖掘

本文链接：https://blog.csdn.net/2401_84032998/article/details/138048070

版权

背景描述

泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日，在她的处女航中，泰坦尼克号在与冰山相撞后沉没，在船上的 2224 名乘客和机组人员中，共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会，从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。

数据说明

数据描述：

变量名称	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
变量解释	乘客编号	是否存活	船舱等级	姓名	性别	年龄	兄弟姐妹和配偶数量	父母与子女数量	票的编号	票价	座位号	登船码头

数据来源

Titanic Competition : How top LB got their score

二特征工程

1. 合并训练集与测试集

import pandas as pd

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
train_and_test = train.append(test, sort=False) # 合并训练集与测试集
PassengerId = test['PassengerId']
train_and_test.shape

2. 缺失值处理

2.1 填充Embarked字段

mode = train_and_test['Embarked'].mode().iloc[0] # 找到众数
train_and_test['Embarked'].fillna(mode, inplace=True)
train_and_test.info()

在这里插入图片描述

2.2 填充船票Fare字段

train_and_test['Fare'].mean()

在这里插入图片描述

Fare_mean = train_and_test['Fare'].mean()
train_and_test['Fare'].fillna(Fare_mean, inplace=True)
train_and_test.info()

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我今天ac了吗

关注关注

32
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

泰坦尼克号生存预测（超详细）

s_m_c的博客

01-15

6万+

这是自己做的第一个python关于数据处理的项目，主要过程包括数据预处理、特征提取、特征选择、模型构建与求解，每一部分都经过自己的分析和总结。第二部分：泰坦尼克号生存率预测一、实验目的通过数据堆叠、数据清洗、特征提取、特征选择、构建模型等方法，实现对泰坦尼克号生存人数的预测。二、实验内容 1、提出问题 2、理解数据 3、数据清洗 4、特征提取 5、特征选择 6、构建模型 7、方案实施三、实验过程记录 1、提出问题已给的数据包含训练数据和测试数据，其中训练数据维度为 891 12，测试数据集维度

泰坦尼克号乘客生存预测

每天进步一点

07-22

5996

泰坦尼克号乘客获救预测原网址：https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12282042.0.0.3fa02042COPRZr&postId=6471 1. 案例背景 泰坦尼克号沉船事故是世界上最著名的沉船事故之一。1912年4月15日，在她的处女航期间，泰坦尼克号撞上冰山后沉没，造成2224名乘客和机组人员中超过150...

参与评论您还未登录，请先登录后发表或查看评论

实验六：泰坦尼克生存预测之缺失值处理

12-08

3732

一、任务描述背景故事： 泰坦尼克号（RMS Titanic），又译作铁达尼号，是英国白星航运公司下辖的一艘奥林匹克级游轮，排水量46000吨，于1909年3月31日在北爱尔兰贝尔法斯特港的哈兰德与沃尔夫造船厂动工建造，1911年5月31日下水，1912年4月2日完工试航。泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船，有“永不沉没”的美誉。然而不幸的是，在它的处女航中，泰坦尼克号便遭厄运——它从英国南安普敦出发，途经法国瑟堡-奥克特维尔以及爱尔兰科夫(Cobh)，驶向美国纽约。1912年

泰坦尼克号乘客生存概率预测项目

weixin_30205153的博客

10-28

1004

本文还有配套的精品资源，点击获取简介：本项目通过机器学习和深度学习技术预测泰坦尼克号乘客的生存概率。初学者将使用历史数据如年龄、性别、票价等，学习数据预处理、特征工程、模型选择与训练，并通过各种评估指标来理解和解释模型预测结果。项目利用Jupyter Notebook进行演示，包括数据加载、清洗、特征分析、模型构建和结果可视化等步骤。通过这个项目，新手能够掌握机器学习和深...

机器学习——泰坦尼克号乘客生存预测（超详细）

荆鹏的博客

02-01

5646

接着就是模型构建，这里我选择了逻辑回归、KNN、SVM三种核函数、深度学习等算法，并进行了模型之间的对比，同时还使用了K折交叉验证，利用bagging算法进行模型融合，防止过拟合，输出预测错误的样本来进行模型调节等等。③如果缺值的样本适中，而该属性为连续值特征属性，有时候我们会考虑给定一个step(比如这里的age，我们可以考虑每隔2/3岁为一个步长)，然后把它离散化，之后把NaN作为一个type加到属性类目中。④有些情况下，缺失的值个数并不是特别多，那我们也可以试着根据已有的值，拟合一下数据，补充上。

泰坦尼克号乘客生存情况预测分析总

ZShiJ的博客

04-28

2198

Titanic数据集在数据分析领域是十分经典的数据集，非常适合刚入门的小伙伴进行学习！泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日，在她的处女航中，泰坦尼克号在与冰山相撞后沉没，在船上的 2224 名乘客和机组人员中，共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会，从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素，但有些人比其他人更容易存活下来，究竟有哪些因素影响着最终乘客的生存与否呢?

泰坦尼克号乘客生存情况预测分析1

ZShiJ的博客

04-27

2026

泰坦尼克号乘客生存预测数据集

NaiveN00b的博客

02-09

1143

泰坦尼克号乘客生存预测---bilibili视频所需数据集

泰坦尼克号乘客生存预测下

欢迎来到我今天ac了吗的博客

04-26

889

泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日，在她的处女航中，泰坦尼克号在与冰山相撞后沉没，在船上的 2224 名乘客和机组人员中，共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会，从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。

泰坦尼克号乘客生存预测+数据挖掘完整案例+泰坦尼克号乘客数据集

06-30

泰坦尼克号乘客生存预测+数据挖掘完整案例+泰坦尼克号乘客数据集 #### (一)数据读取 * 读取数据，并进行展示 * 统计数据各项指标 * 明确数据规模与要完成的任务 #### (二)特征理解分析 * 单特征分析，逐个变量...

泰坦尼克号乘客生存预测.ipynb

06-14

——学习参考资料：仅用于个人学习使用！本代码仅作学习交流，切勿用于商业用途，否则后果自负。若涉及侵权，请联系，会尽快处理! 未进行详尽测试，请自行调试!

泰坦尼克号生存预测数据集.zip

04-15

[泰坦尼克号乘客生存情况预测分析1](https://blog.csdn.net/m0_53054984/article/details/137784712) [泰坦尼克号乘客生存情况预测分析2](https://blog.csdn.net/m0_53054984/article/details/137786387) [泰坦尼克...

泰坦尼克乘客生存预测-kaggle-数据集

03-31

《泰坦尼克号乘客生存预测：深度解析kaggle数据集》在机器学习领域，经典的数据集往往能激发无尽的研究与探索。"泰坦尼克乘客生存预测-kaggle-数据集"便是这样一个备受瞩目的案例。这个数据集源自于世界著名的...

【AI提示词】马斯洛需求分析专家

科学推动技术，技术成就科学

05-08

1304

在XX国际汽车零部件制造企业的员工需求优化项目中，通过应用马斯洛需求层次理论，针对中国区和德国区的文化差异进行了深入分析。项目首先设计了多维需求评估量表，并根据不同文化背景进行了校准。数据分析显示，中国区在自我实现和晋升透明度方面存在显著不足，而德国区则在跨部门协作和创新资源匹配上表现欠佳。基于这些发现，项目团队制定了一系列文化适配型解决方案，如中国区的“智慧通勤补贴”和德国区的“个人实验室专项基金”。实施6个月后，中国区离职率显著下降，德国区专利申报量大幅增加。项目不仅有效解决了企业痛点，还形成了可复用的

零基础学Java——第十一章：实战项目 - 控制台应用开发

qqxhb 资源共享

05-09

851

本章介绍了如何开发一个Java控制台应用，重点以学生信息管理系统为例进行实战演练。控制台应用具有简单直接、开发效率高、资源消耗低等特点，适合后台服务和快速验证想法。常见的控制台应用包括文本处理工具、数据分析程序、简单游戏和系统工具等。学生信息管理系统的需求包括添加、删除、修改、查询学生信息，以及数据持久化和加载。系统设计包括Student、StudentManager、FileHandler和Main四个类，分别负责学生信息的存储、管理、文件操作和程序入口。通过这一项目，读者可以将Java基础知识、面向对象

2025年软件工程与数据挖掘国际会议(SEDM 2025)

2403_89423032的博客

05-06

504

2025年软件开发与数据挖掘国际会议于魅力古城太原盛大召开，汇聚了全球顶尖的软件开发专家、数据科学家及行业精英。

【project】--数据挖掘

2401_88076102的博客

05-11

201

【代码】【project】--数据挖掘。

毕业设计-多商家营销活动平台V1.3.9小程序前后端完整全开源解密源码-整站商业源码.zip

05-12

毕业设计-多商家营销活动平台V1.3.9小程序前后端完整全开源解密源码-整站商业源码.zip

电力系统动态状态估计：基于扩展卡尔曼滤波(EKF)和无迹卡尔曼滤波(UKF)的技术应用与比较