这是一个强大的函数,要掌握它也不是一件容易的事情,慢慢来吧,今天只把一部分内容作为记录,边用边补充吧!
pivot_table是以交叉表的形式对两个或两个以上的变量进行对比分析。
交叉计数函数及参数:
pivot_table(data, values=None, index=None, columns=None, aggfunc=’mean’, fill_value=None, margins=False, dropna=True, margins_name=’All’)
data: DataFrame对象
values: 数据透视表中的值
index: 索引
aggfunc:所用的统计函数
fill_value:默认值替换
举例:
该代码所用数据是Titanic数据集,Pclass是等级;Survived代表是否存活,取值为0和1,最终得到不同等级平均存活。
最终得到不同等级平均年龄。
最终得到不同登船码头下总船票与总获救人数。