利用Pandas中pivot_table函数生成数据透视表

柚子一只

于 2019-02-27 11:44:14 发布

阅读量2.3k

点赞数

分类专栏： Python 数据分析文章标签： Pandas透视表 pivot_table

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32572085/article/details/87969775

版权

本文详细介绍了如何使用Pandas中的pivot_table函数生成数据透视表，通过实例讲解了数据读取、处理、高级透视表过滤等步骤，并提供了一个pivot_table的备忘单，帮助读者掌握这一数据分析利器。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、介绍

也许大多数人都有在Excel中使用数据透视表的经历，其实Pandas也提供了一个类似的功能，名为pivot_table。虽然pivot_table非常有用，但是我发现为了格式化输出我所需要的内容，经常需要记住它的使用语法。所以，本文将重点解释pandas中的函数pivot_table，并教大家如何使用它来进行数据分析。

如果你对这个概念不熟悉，wikipedia上对它做了详细的解释。顺便说一下，你知道微软为PivotTable（透视表）注册了商标吗？其实以前我也不知道。不用说，下面我将讨论的透视表并不是PivotTable。

作为一个额外的福利，我创建了一个总结pivot_table的简单备忘单。你可以在本文的最后找到它，我希望它能够对你有所帮助。如果它帮到了你，请告诉我。

二、数据

使用pandas中pivot_table的一个挑战是，你需要确保你理解你的数据，并清楚地知道你想通过透视表解决什么问题。其实，虽然pivot_table看起来只是一个简单的函数，但是它能够快速地对数据进行强大的分析。

在本文中，我将会跟踪一个销售渠道（也称为漏斗）。基本的问题是，一些销售周期很长（可以想一下“企业软件”、“资本设备”等），而管理者想更详细地了解它一整年的情况。

典型的问题包括：

本渠道收入是多少？
渠道的产品是什么？
谁在什么阶段有什么产品？
我们年底前结束交易的可能性有多大？

很多公司将会使用CRM工具或者其他销售使用的软件来跟踪此过程。虽然他们可能拥有有效的工具对数据进行分析，但肯定有人需要将数据导出到Excel，并使用一个透视表工具来总结这些数据。

使用Pandas透视表将是一个不错的选择，应为它有以下优点：

更快（一旦设置之后）
自行说明（通过查看代码，你将知道它做了什么）
易于生成报告或电子邮件
更灵活，因为你可以定义定制的聚合函数

1、Read in the data

首先，让我们搭建所需的环境。

如果你想跟随我继续下去，那么可以下载这个Excel文件。

import pandas as pd
import numpy as np

因为Pivot_table API已经随着时间有所改变，所以为了使本文中示例代码能够正常工作，请确保你安装了最近版本的Pandas（>0.15）。本文示例还用到了category数据类型，而它也需要确保是最近版本。

首先，将我们销售渠道的数据读入到数据帧中。

df =

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。