python分类汇总_数据分析番外篇13_利用Python实现分类汇总

weixin_39949894

于 2020-11-27 21:46:05 发布

阅读量749

点赞数

文章标签： python分类汇总

本文介绍了如何使用Python的Pandas库处理数据，实现类似于Excel透视表的分类汇总功能。在处理过程中，遇到了数据类型识别、千位符问题以及编码问题，最终通过去除千位符并调整编码成功完成了分类汇总。

摘要由CSDN通过智能技术生成

自己建立了一个数据分析兴趣小组群，在分享了一篇有关Python的介绍后，这两天大家的学习热情高涨，于是纷纷将自己的问题扔到群里诱使大家来解决，比如：如何代码实现去除文本里面的多余空格，如何将一个27万行的数据一次导入Excel等。有个成员提出利用SQL语言来实现一个2万行数据的分类汇总，可是俺不会SQL，就想试试用Python能否实现。

首先来看看数据吧（该数据没有脱敏，大家看看就好），数据包含了5列，2万多行，希望能根据地区对销售金额和毛利进行汇总。

分类汇总后达到如下效果：

其实精通Excel的同学知道这个很容易，直接来个透视表就搞定了，但是使用Python能不能也搞定呢？让我们一起来踩坑，跳坑吧。

首先看看数据结构，很明显这是个完美的dataframe，所以可以利用Pandas来对其进行处理，将数据读入，然后使用groupby就能实现分类汇总了。原理很简单，但是过程充满了艰辛。首先导入数据，然后查看一下Dataframe结构

看起来数据导入比较顺利，数据结构也算工整，可以开始进行分类汇总了

使用groupby后，居然是这个结果！说好的，groupby会直接忽略掉文本，而直接将数值进行分组操作吗？为啥“销售金额”不见了，而且“店铺”和“CLASS”这个两个包含文本的列也被强行汇总求和了？

看到这结果，首先想到的是不让“店铺”和“CLASS”参加groupby，通过索引，只将“地区”、“销售金

最低0.47元/天解锁文章

weixin_39949894

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python分类汇总_数据分析番外篇13_利用Python实现分类汇总

自己建立了一个数据分析兴趣小组群，在分享了一篇有关Python的介绍后，这两天大家的学习热情高涨，于是纷纷将自己的问题扔到群里诱使大家来解决，比如：如何代码实现去除文本里面的多余空格，如何将一个27万行的数据一次导入Excel等。有个成员提出利用SQL语言来实现一个2万行数据的分类汇总，可是俺不会SQL，就想试试用Python能否实现。首先来看看数据吧（该数据没有脱敏，大家看看就好），数据包含了5...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。