Python数据分析11——数据清洗（五）

最新推荐文章于 2022-06-04 14:07:01 发布

Py.ziMing

最新推荐文章于 2022-06-04 14:07:01 发布

阅读量291

点赞数 2

分类专栏：数据分析文章标签：数据分析 pandas python 小白数据清洗

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44080811/article/details/90734609

版权

数据分析专栏收录该内容

40 篇文章 9 订阅

订阅专栏

虽然，数据清洗来到第五篇了，但是我还是没有能够把它弄明白讲清楚，还是要耗费更加多的时间才行。

数据重塑

在这里，只有两个核心的方法：stack()和unstack()。

Stack()——将DataFrame的列旋转为行

新建的数据集如下。
在这里插入图片描述
下面进行翻转，然后就变成Series数据集了。

Unstack()——将DataFrame的行旋转为列

再翻转，就变回原样了。
在这里插入图片描述
同时，还可以对其它级别进行操作。

注意：不仅数据重塑湿最内层的，还会把旋转轴置于最低级别。新建的数据集如下所示：

注意下面最内层index的位置变化。
在这里插入图片描述

字符串处理

字符串方法

新建的数据集如下所示：
在这里插入图片描述
下面，通过字符串方法切分数据并且另起一行。

同时，pandas模块的str属性还有多种玩法。

正则表达式

这一部分，主要问题不在于模块及方法的使用，根源还是要看自己的正则表达式的功力。

新建的数据集如下所示：
在这里插入图片描述下面来演示如何使用。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析11——数据清洗（五）

groupby按列名分组按字典分组按函数分组
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。