长表、宽表的变形
长表
长表 : 列是列,行是行,值是值,按照常规表格的形式展现出来的。
代码实战:
df = pd.DataFrame({'Class':[1,1,2,2],
'Name':['San Zhang','San Zhang','Si Li','Si Li'],
'Subject':['Chinese','Math','Chinese','Math'],
'Grade':[80,75,90,85]})
print(df)
运行结果:
Class Name Subject Grade
0 1 San Zhang Chinese 80
1 1 San Zhang Math 75
2 2 Si Li Chinese 90
3 2 Si Li Math 85
宽表
宽表 :列columns变行index,某一列的分类值变成列名,然后进行相关值的排序。
print(df.pivot(index='Name', columns='Subject', values='Grade'))
运行结果:
Subject Chinese Math
Name
San Zhang 80 75
Si Li 90 85
两者的格式、行index、列columns、值values的排布。
注意:
长表和宽表是数据的呈现方式不一样,其实数据的内容和含义是相同的。
就像一个人有多种身份:在学校是学生,在家里是孩子,在商店是顾客,等等。但这个人始终是Ta本身。
变形
表的变形
索引的变形
其他变形函数