Python学习笔记:索引

本文介绍了Pandas库中DataFrame对象的reset_index()和reindex()方法。reset_index()用于重置数据框的索引,消除重复并可选择性删除旧索引;reindex()则允许对行和列索引进行重新排列,可以扩展或缩减索引,同时提供了插值处理选项,如'ffill'和'bfill'。这两个方法在数据处理中非常常见,帮助保持数据结构的清晰和有序。
摘要由CSDN通过智能技术生成

1. frame.reset_index()

情景:在循环读取数组时,是最常触及到数组索引的场景,

比如数组data_stfx想要逐条读取数组数据,操作如下:

for i in range(len(data_stfx)):  

     print(i, data_stfx.loc[i,:])       // data_stfx.loc[i,:]   获取索引为i的数据

i的值是从0开始,数组data_stfx的长度减1结束

如果数组data_stfx是有多个数组组合而成,并且保留了原本的索引,那么索引的值可能重复,

这时就需要重置索引。

方法:data_stfx.reset_index(drop=True)

 

2. frame.reindex()

可以对行和列索引,默认对行索引,加上关键字columns对列索引。

e.g

import pandas as pd

data=[[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]]

df = pd.DataFrame(data,index=['d','b','c','a'])

print(df)

2.1 对行索引示例如下:

如果定义的索引数量超过了数据行数,则该索引行数据为NaN

df=df.reindex(['a','b','c','d','e'])

print(df)

如果定义的新索引是旧索引的子集,则索引在此起到条件作用,即没有定义的索引不被抓取

df=df.reindex(['b','c','a','e'])

print(df)

 

2.2 队列索引示例如下:

df=df.reindex(columns=[0,1,2,4,3])

print(df)

 

2.3插值处理:

对于index为有序的数据,我们有时候可能会进行一些插值处理,只需要在reindex加上method参数即可,参数如下表:

import pandas as pd

df = pd.Series(['blue', 'purple', 'yellow'], index=[0, 2, 4])

print(df)

df = df.reindex(range(6), method='ffill')

或者

df = df.reindex(range(6), method='pad')

print(df)

df = df.reindex(range(6), method='bfill')

或者

df = df.reindex(range(6), method='backfill')

print(df)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值