感想
首先,pandas变形工具有:pivot、pivot_table、melt、wide_to_long、stack、unstack、crosstab、explode、get_dummies。
1、pivot与pivot_table
这两个函数,就相当于excel表的数据透视功能。
两者的区别是:
pivot:不需要聚合函数;每行数据是唯一的,不存在重复数据,否则报错。
pivot_table:用到聚合函数,可实现维度变化的数据统计功能
2、melt
melt 和 pivot 是一组互逆过程。
3、stack与unstack
索引变形工具。在 unstack 中必须保证 被转为列索引的行索引层 和 被保留的行索引层 构成的组合是唯一的。
4、get_dummies
用于特征构建的重要函数之一,其作用是把类别特征转为指示变量。相当于升维。
参考资料:https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch5.html