数据挖掘实战项目-kaggle泰坦尼克号生还者预测–ing
kaggle泰坦尼克号生还者预测
泰坦尼克号:从灾难中学习机器
kaggle网站连接:链接: https://www.kaggle.com/c/titanic
一、实战项目描述
1、项目概述-泰坦尼克号:从灾难中学习机器
挑战-泰坦尼克号的沉没是历史上最臭名昭著的海难之一。
1912年4月15日,泰坦尼克号在首次航行期间撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。沉船导致大量伤亡的原因之一是没有足够的救生艇给乘客和船员。虽然幸存下来有一些运气因素,但有一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在本文中将对哪些人可能生存作出分析,特别是运用Python和机器学习的相关模型工具来预测哪些乘客幸免于难,最后提交结果。从kaggle泰坦尼克生存预测项目下载相关数据。
2、要求-根据数据预测幸免于难的乘客
在这一挑战中,我们要求您建立一个预测模型来回答以下问题:“什么样的人更有可能生存?” 使用乘客数据(即姓名,年龄,性别,社会经济舱等)。
在本竞赛中,您将可以访问两个类似的数据集,其中包括乘客信息,例如姓名,年龄&#x