泰坦尼克号生存分类数据集

泰坦尼克号生存分类数据集

【下载地址】泰坦尼克号生存分类数据集 本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件:训练集和测试集。数据集主要用于训练和评估机器学习模型,以预测泰坦尼克号乘客的生存情况 【下载地址】泰坦尼克号生存分类数据集 项目地址: https://gitcode.com/open-source-toolkit/35561

简介

本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件:训练集和测试集。数据集主要用于训练和评估机器学习模型,以预测泰坦尼克号乘客的生存情况。

数据集内容

  • 训练集(train.csv):包含乘客的详细信息以及他们的生存状态(是否生还)。
  • 测试集(test.csv):包含乘客的详细信息,但不包含生存状态,用于模型预测。

数据字段说明

数据集中的字段包括:

  • PassengerId:乘客ID
  • Survived:是否生还(0 = 未生还,1 = 生还)
  • Pclass:船舱等级(1 = 头等舱,2 = 二等舱,3 = 三等舱)
  • Name:乘客姓名
  • Sex:性别
  • Age:年龄
  • SibSp:兄弟姐妹/配偶的数量
  • Parch:父母/子女的数量
  • Ticket:船票号码
  • Fare:票价
  • Cabin:船舱号码
  • Embarked:登船港口(C = 瑟堡,Q = 皇后镇,S = 南安普顿)

使用场景

该数据集适用于以下场景:

  • 机器学习模型的训练和评估
  • 数据分析和可视化
  • 特征工程和数据预处理

注意事项

  • 数据集中可能存在缺失值,需要进行数据清洗和预处理。
  • 测试集不包含生存状态,需要使用训练集训练模型后进行预测。

贡献

欢迎对该数据集进行改进和扩展,包括但不限于:

  • 数据清洗和预处理脚本
  • 模型训练和评估代码
  • 数据分析和可视化工具

请通过提交Pull Request的方式贡献您的代码和想法。

许可证

本数据集遵循开源许可证,具体信息请参考LICENSE文件。

【下载地址】泰坦尼克号生存分类数据集 本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件:训练集和测试集。数据集主要用于训练和评估机器学习模型,以预测泰坦尼克号乘客的生存情况 【下载地址】泰坦尼克号生存分类数据集 项目地址: https://gitcode.com/open-source-toolkit/35561

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

邴卉露Robust

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值