pandas中透视表的使用
df.pivot_table(values, index, columns, aggfunc, margins)
•values: 透视表中的元素值(根据聚合函数得出的)
•index:透视表的行索引
•columns:透视表的列索引
•aggfunc:聚合函数,可以指定多个函数
•margins:表示是否对所有数据进行统计
举一个例子
cars_df = pd.read_csv('cars.csv') #数据为不同品牌车的数据
cars_df.head()
比较不同年份的不同厂商的车,在电池方面的不同
ars_df.pivot_table(values='(kW)', index='YEAR', columns='Make', aggfunc=np.mean) #因为比较的是在电池方面的不同因此values即透视表中元素的值为kw,因为每年的各种车的kw不止是一个所以需要用聚合函数aggfunc求均值,比较的是不同年份不同厂商,所以行索引为year,列索引为make
聚合函数可以有多种
cars_df.pivot_table(values='(kW)', index='YEAR', columns='Make', aggfunc=[np.mean, np.min], margins=True)