Python数据透视表
1、Excel数据透视表
数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关
之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不同方式分析数据,也可以重新安排行号、列标和页字段。每一次改变版面布置时,数据透视表会立即按照新的布置重新计算数据。另外,如果原始数据发生更改,则可以更新数据透视表
Excel数据透视表入门:
1) 选择数据范围,插入数据透视表
2) 设置数据透视表的行列字段
- 行: 行字段,可多个,自由排列顺序
- 列: 列字段,排列方式不同,行列混合则起到交叉的作用
- 筛选: 筛选器用于分页使用
- 值: 汇总方式/显示方式,汇总方式如求和、计数、平均值等,显示方式如显示百分比、升序、降序等,双击数值可查看明细
2、Python数据透视表
2.1、语法结构
'''
pd.pivot_table() 或 df.pivot_table()
'''
'''
pivot_table(data, values, index, columns, aggfunc='mean', fill_value, margins=False, dropna=True, margins_name='All')
- data:DataFrame对象
- values:需要计算的数据列
- index:行层次的分组键,从而形成多级索引,str或list类型
- columns:列层次的分组键,从而形成多级列名,str或list类型
- aggfunc:对数据执行的聚合操作函数,默认mean计算平均(支持应用多个函数)
- fill_value:设定缺失替换值
- margins:是否添加行列的汇总
- dropna:如果列的所有值都为NaN,将不作为计算列,默认True
- margins_name:汇总行列的名称,默认为All
'''
2.2、基本使用
import numpy as np
import pandas as pd
# 读取数据
df = pd.read_excel(r'C:\Users\cc\Desktop\pivot_table.xlsx')
print(df.to_string())
'''
商品ID 商品名称 城市