python数据清理方面一般都会用到 df.describe()这个函数,但其实这是可以传参数的。比如以泰坦尼克号生存预测为例
先看下数据整体情况
Data = pd.read_csv(r'../input/titanic/train.csv')
Data.head()
Data.info()
Data.describe()
df.describe(include='O') # 大写英文字母 O
df.describe(include='all')
可以看出默认是描述数字类型的属性,而include= “O“ 则是描述object类型的熟悉, include= ”all“则是对所有属性的描述。