titanic.isnull().sum(): 统计为null的值的个数
value_counts():统计一个字段所有可能值出现的个数
print admissions[‘predicted_label’].value_counts()
print admissions.head()
:
0 598
1 46
Name: predicted_label, dtype: int64
admit gpa gre predicted_label
0 0 3.177277 594.102992 0
1 0 3.412655 631.528607 0
2 0 2.728097 553.714399 0
3 0 3.093559 551.089985 0
4 0 3.141923 537.184894 0
unique():穷举对应列所有可能的值
kobe.action_type.unique()
get_dummies()
如分类数据的结果是字符串,映射成数字,有几个结果就生成几列,对每一个数据,给对应的列赋值1,其他列赋值0