学习如何利用pandas对数据进行处理,以下是一个用于练习的Excel表格
表格背景:统计了泰坦尼克号上所有船员的信息,包括姓名,性别,年龄,是否生还等。
利用pandas对表格进行分析,查看性别,年龄等因素对船员生还概率的影响
panda中的一些统计操作
import pandas as pd
import matplotlib.pyplot as plt
abs_path = 'F:/AAAA/titanic(泰坦尼克)/titanic(泰坦尼克)/train.csv' #文件路径
titanic = pd.read_csv(abs_path)
pd.set_option('display.max_columns', None) #显示完整的列
pd.set_option('display.max_rows', None) #显示完整的行
pd.set_option('display.width', None) #每行的宽度
print(titanic.head()) #查看前五行
print(titanic.describe()) #所有数值类型的字段做一个统计
print(titanic.isnull().sum()) #返回空值的个数
#填充所有的空值 titanic.fillna(0,inplace = True)