从零开始数据分析Kaggle项目—泰坦尼克号（二）

最新推荐文章于 2024-07-15 10:06:36 发布

一个游在的小鱼

最新推荐文章于 2024-07-15 10:06:36 发布

阅读量936

点赞数

分类专栏： python数据清洗及可视化文章标签：数据分析数据挖掘机器学习

本文链接：https://blog.csdn.net/weixin_45058606/article/details/121955039

版权

从零开始数据分析Kaggle项目—泰坦尼克号1—1.2

# title: "Kaggle项目泰坦尼克号 1__1.2"
# author: "小鱼"
# date: "2021-12-15"

import pandas as pd
import numpy as np
import os

df = pd.read_csv("train.csv")

df

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Parch	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	0	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	0	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	0	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	0	373450	8.0500	NaN	S
...	...	...	...	...	...	...	...	...	...	...	...	...
886	887	0	2	Montvila, Rev. Juozas	male	27.0	0	0	211536	13.0000	NaN	S
887	888	1	1	Graham, Miss. Margaret Edith	female	19.0	0	0	112053	30.0000	B42	S
888	889	0	3	Johnston, Miss. Catherine Helen "Carrie"	female	NaN	1	2	W./C. 6607	23.4500	NaN	S
889	890	1	1	Behr, Mr. Karl Howell	male	26.0	0	0	111369	30.0000	C148	C
890	891	0	3	Dooley, Mr. Patrick	male	32.0	0	0	370376	7.7500	NaN	Q

891 rows × 12 columns

list(df)

['PassengerId',
 'Survived',
 'Pclass',
 'Name',
 'Sex',
 'Age',
 'SibSp',
 'Parch',
 'Ticket',
 'Fare',
 'Cabin',
 'Embarked']

#查看DataFrame数据的每列的名称
df.columns

Index(['PassengerId', 'Survived', 'Pclass', 'Name', 'Sex', 'Age', 'SibSp',
       'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'],
      dtype='object')

# 查看"Cabin"这列的所有值 [有多种方法]
df['Cabin']

0       NaN
1       C85
2       NaN
3      C123
4       NaN
       ... 
886     NaN
887     B42
888     NaN
889    C148
890

最低0.47元/天解锁文章

一个游在的小鱼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从零开始数据分析Kaggle项目—泰坦尼克号（二）

从零开始数据分析Kaggle项目—泰坦尼克号1—1.2
复制链接

扫一扫

专栏目录

从零开始数据分析Kaggle项目—泰坦尼克号（二）

“相关推荐”对你有帮助么？