import pandas as pd
# 数据加载
train_data = pd.read_csv('./Titanic_Data/train.csv')
test_data = pd.read_csv('./Titanic_Data/test.csv')
# 数据探索
#info() 了解数据表的基本情况:行数、列数、每列的数据类型、数据完整度
print(train_data.info())
print('-'*30)
#describe() 了解数据表的统计情况:总数、平均值、标准差、最小值、最大值
print(train_data.describe())
print('-'*30)
#describe(include=['O']) 查看字符串类型(非数字)的整体情况
print(train_data.describe(include=['O']))
print('-'*30)
#head() 查看前几行数据(默认是前五行)
print(train_data.head())
print('-'*30)
#tail() 查看后几行数据(默认是最后五行)
print(train_data.tail())