Pandas进阶

数据重塑和轴向旋转:

层次化索引:

层次化索引是pandas的一项重要功能,他能使我们再一个轴上拥有多个索引

 

多索引可以使得Series和DataFrame相互转换:

数据旋转

T 可以直接让数据的行和列进行交换

data.T  #貌似是转置矩阵

dataframe也可以使用stack和unstack,转化为层次索引的Series

data.stack()  #层次化seris,具体的行数据内容

data.stack().unstack()   #去除层次化,变回原样

数据分组,分组运算:

GroupBy技术:实现数据的分组,和分组运算,作用类似于数据透视表

只会对数值变量进行分组运算

group=df.groupby(df['产地'])  

##分组操作,根据哪一列进行分组

group.mean().head()   #分组后进行相关操作

df.groupby([df['产地'],df['年代']]).mean().head()  

df['评分'].groupby([df['产地'],df['年代']]).mean()

#明确对某一个数值变量列进行操作,而不是所有的数值变量列

#根据多变量进行分组,有先后顺序

Series通过unstack方法转化为dataframe——会产生缺失值

离散化处理:

合并数据集:

 

merge方法举例:

 

(3)concat

将多个相同类型的数据集进行批量合并

dff=pd.concat([df1,df2,df3],axis=0)

##默认axis=0 增加行数,axis=1增加列数,默认是纵向连接。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉淀体育生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值