1:对于na数据的操作;
1):dropna()
2):fillna() #可以用均值,众数,中位数填充
2:统计关联到某一列,比如一个sex列:让你统计一下不同男女的身高:
这是后就用到了,
human.pivot_table(index='sex',values='height',aggfunc=np.mean)
他的意思就是以sex为下标,一般时男和女,统计男女的平均身高,这个函数如果不指定agggunc默认是求平均值,
还可以传入其他的函数,sum,min之类的
值是统计一个量与一个之间的,那么怎样统计一个量与多个量之间呢;
只需要在values参数给值的时候传入一个list就行了,
3:定位莫一个样本的某一列,也可以理解为找到特定行的某一列,
row_index_78_Sex = human.loc[78,'sex']即可