SPSS Modeler泰坦尼克号幸存者分析

这篇博客通过SPSS Modeler对Kaggle泰坦尼克号数据进行分析,包括数据介绍、缺失值处理和初步可视化。作者探讨了乘客的年龄、性别、船舱等级与幸存率的关系,以及登船码头和家庭成员数量的影响。通过对年龄的均值插补和删除登船码头、船舱缺失值,进行了深入的数据预处理。初步发现,第三等级男性较多,儿童可能在逃生中获优先考虑,且皇后镇登船的乘客多为三等舱。
摘要由CSDN通过智能技术生成

数据来源:“Kaggle泰坦尼克号挑战杯”竞赛泰坦尼克号数据
PS:需要创建一个帐户才能访问数据。
下载的数据是.CSV格式
在这里插入图片描述

1. 数据介绍

数据集中共有12个字段,PassengerId:乘客编号,Survived:乘客是否存活,Pclass:乘客所在的船舱等级;Name:乘客姓名,Sex:乘客性别,Age:乘客年龄,SibSp:乘客的兄弟姐妹和配偶数量,Parch:乘客的父母与子女数量,Ticket:票的编号,Fare:票价,Cabin:座位号,Embarked:乘客登船码头。 共有891位乘客的数据信息。其中177位乘客的年龄数据缺失,2位乘客的登船码头数据缺失,687位乘客的船舱数据缺失。
在这里插入图片描述

2.分析角度

所有好的数据分析项目都是从回答问题开始的。 现在,我们已经知道了列类别的数据,让我们来思考一些我们想从数据中得到的问题或见解。 这里有一个问题列表:
一些基本的问

  • 16
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据分析打怪升级ing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值