python pandas 对series和dataframe的重置索引reindex

python pandas 对series和dataframe的重置索引reindex

reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行。且不会修改原数组,要修改需要使用赋值语句。

series.reindex()

import pandas as pd
import numpy as np
obj = pd.Series(range(4), index=['d', 'b', 'a', 'c'])
print obj

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
d    0
b    1
a    2
c    3
dtype: int64   

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
print obj.reindex(['a', 'b', 'c', 'd', 'e'])
  
  
  • 1
a    2.0
b    1.0
c    3.0
d    0.0
e    NaN
dtype: float64

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

多出的索引‘e’会被赋值NaN

内插或填充method

obj1=pd.Series(range(3), index=['a', 'c', 'e'])
print obj1.reindex(['a', 'b', 'c', 'd', 'e'],method='pad')
  
  
  • 1
  • 2
a    0
b    0
c    1
d    1
e    2
dtype: int64

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

ffill或pad: 前向(或进位)填充
bfill或backfill: 后向(或进位)填充

dataframe.reindex()

dataframe.reindex()可以改变(行)索引,列或两者。当只传入一个序列时,行被重新索引,一次可以对两个重新索引,可是插值只在行侧(0坐标轴)进行

frame = pd.DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'], columns=['c1', 'c2', 'c3'])
print frame
  
  
  • 1
  • 2
   c1  c2  c3
a   0   1   2
c   3   4   5
d   6   7   8

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
states = ['c1', 'b2', 'c3']
frame.reindex(columns=states)
  
  
  • 1
  • 2
c1b2c3
a0NaN2
c3NaN5
d6NaN8

列名不一样的会被赋值nan

frame_na=frame.reindex(index=['a', 'b', 'c', 'd'], method='ffill', columns=states)
print frame_na
  
  
  • 1
  • 2
   c1  b2  c3
a   0 NaN   2
b   0 NaN   2
c   3 NaN   5
d   6 NaN   8

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

插值只在行侧(0坐标轴)进行,但是我们可以在其之后,对nan值进行填充

frame_na.fillna(method='ffill',axis=1)
  
  
  • 1
c1b2c3
a0.00.02.0
b0.00.02.0
c3.03.05.0
d6.06.08.0
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值