Pandas进阶

最新推荐文章于 2023-01-08 23:32:24 发布

沉淀体育生

最新推荐文章于 2023-01-08 23:32:24 发布

阅读量193

点赞数 1

分类专栏： Python 数据分析与数据挖掘文章标签：大数据 python 数据分析 pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46803857/article/details/116463572

版权

Python 数据分析与数据挖掘专栏收录该内容

20 篇文章 10 订阅

订阅专栏

数据重塑和轴向旋转：

层次化索引：

层次化索引是pandas的一项重要功能，他能使我们再一个轴上拥有多个索引

多索引可以使得Series和DataFrame相互转换：

数据旋转

T 可以直接让数据的行和列进行交换

data.T #貌似是转置矩阵

dataframe也可以使用stack和unstack，转化为层次索引的Series

data.stack() #层次化seris,具体的行数据内容

data.stack().unstack() #去除层次化，变回原样

数据分组，分组运算：

GroupBy技术：实现数据的分组，和分组运算，作用类似于数据透视表

只会对数值变量进行分组运算

group=df.groupby(df['产地'])

##分组操作，根据哪一列进行分组

group.mean().head() #分组后进行相关操作

df.groupby([df['产地'],df['年代']]).mean().head()

df['评分'].groupby([df['产地'],df['年代']]).mean()

#明确对某一个数值变量列进行操作，而不是所有的数值变量列

#根据多变量进行分组，有先后顺序

Series通过unstack方法转化为dataframe——会产生缺失值

离散化处理：

合并数据集：

merge方法举例：

（3）concat

将多个相同类型的数据集进行批量合并

dff=pd.concat([df1,df2,df3],axis=0)

##默认axis=0 增加行数，axis=1增加列数，默认是纵向连接。

沉淀体育生

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Pandas进阶

数据重塑和轴向旋转：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

沉淀体育生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。