Pandas 可视化图表之crosstab 交叉表

最新推荐文章于 2024-05-08 10:08:59 发布

置顶 andyabs

最新推荐文章于 2024-05-08 10:08:59 发布

阅读量3.3k

点赞数

分类专栏： Python 开发心得文章标签：数据挖掘机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/andyqingliu/article/details/105974775

版权

开发心得同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

前言

接上一篇，pandas.pivot_table是生成透视图，可以对数据进行行列的任意分组转置等操作，很方便。而crosstab则是一种特殊的透视表。

pandas.crosstab介绍

***crosstab***是交叉表，默认是计算分组频率的特殊透视表（默认的聚合函数是统计行列组合出现的次数）。如果指定了聚合函数则按聚合函数来统计，但是要指定values的值，指明需要聚合的数据。

函数原型如下：

pandas.crosstab(index, columns**,** values=None**,** rownames=None**,** colnames=None**,** aggfunc=None**,** margins=False**,** margins_name: str = 'All’, dropna: bool = True**,** normalize=False**)** → ‘DataFrame’

index：指定了要分组的列，最终作为行。

columns：指定了要分组的列，最终作为列。

values：指定了要聚合的值（由行列共同影响），需要指定aggfunc参数。

rownames：指定了行名称。

colnames：指定了列名称。

aggfunc：指定聚合函数。必须指定values的值。

margins：布尔值，是否分类统计。默认False。

margins_name：分类统计的名称，默认是“All”。

dropna：是否包含全部是NaN的列。默认是True。

normalize：标准化统计各行列的百分比。如果传all或者True，将输出当前值对所有值得百分比（分母是所有行列的值）。如果传“index”则对行进行百分比统计。如果传“columns”则对列进行百分比统计。如果margins为True，将会把All的值也计算在内进行百分比统计。PS:实际使用过程中，在指定margins=True的时候，把columns设置为一个series没有问题，但是当换成数组的时候这里报错说All不在DataFrame里面。奇怪，有理解深刻的同学请指点，不胜感激。

参考链接

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.crosstab.html?highlight=crosstab

关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
Pandas 可视化图表之crosstab 交叉表

前言接上一篇，pandas.pivot_table是生成透视图，可以对数据进行行列的任意分组转置等操作，很方便。而crosstab则是一种特殊的透视表。pandas.crosstab介绍***crosstab***是交叉表，默认是计算分组频率的特殊透视表（默认的聚合函数是统计行列组合出现的次数）。如果指定了聚合函数则按聚合函数来统计，但是要指定values的值，指明需要聚合的数据。函数原型...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。