Pandas的MultiIndex多层索引使用

目录

MultiIndex多层索引

1.创建方式

1.1.第一种:多维数组

1.2.第二种:MultiIndex

1.3.创建案例:

2.多层索引操作

2.1.Series多层索引

2.2.DataFrame多层索引

2.3.交换索引

2.4.索引排序

2.5.索引堆叠

2.6.取消堆叠

2.7.设置索引

2.8.重置索引


MultiIndex多层索引

MultiIndex,即具有多个层次的索引,有些类似于根据索引进行分组的形式。通过多层次索引,我们就可以使用高层次的索引,来操作整个索引组的数据。通过给索引分类分组,则可以操作组数据。

1.创建方式

1.1.第一种:多维数组

我们在创建Series或DataFrame时,可以通过给index(columns)参数传递多维数组,进而构建多维索引。
【数组中每个维度对应位置的元素,组成每个索引值】

多维索引也可以设置名称(name性),属性的值为一维数组,元素的个数需要与索引的层数相同(每层索引都需要具有一个名称)。

1.2.第二种:MultiIndex

我们可以通过MultiIndex类的相关方法,预先创建一个MultiIndex对象,然后作为Series与DataFrame中的index(或columns)参数值。同时,可以通过names参数指定多层索引的名称。

  • from_arrays:接收一个多维数组参数,高维指定高层索引,低维指定底层索引。
  • from_tuples:接收一个元组的列表,每个元组指定每个索引(高维索引,低维索引)。
  • from_product:接收一个可迭代对象的列表,根据多个可迭代对象元素的笛卡尔积进行创建索引。

from_product相对于前两个方法而言,实现相对简单,但是,也存在局限。

1.3.创建案例:

import numpy as np
import pandas as pd

import warnings
warnings.filterwarnings('ignore')

#通过给index(columns)参数传递多维数组,进而构建多维索引

# 多层索引,指定一个多维数组。多维数组中,逐级给出每层索引的值。
s = pd.Series([1, 2, 3, 4], index=[["A", "A", "B", "B"], ["a", "b", "c", "d"]])
# 多于多层索引,每一层都具有一个名字。
s.index.names = ["index1", "index2"]
display(s)
display(s.loc["A"].loc["a"])

df=pd.DataFrame(np.arange(9).reshape(3, 3), columns=[["X", "X", "Y"], ["x1", 'x2', 'y1']],index=[["A", "B", "B"], ["a", 'a', 'b']])
display(df)
display(df.loc["B"]) 
display(df["X"])
display(df.loc["B"].loc["a"]["X"]["x1"])

#通过MultiIndex类的方法进行创建。

# 通过列表的方式进行创建。(每个内嵌列

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值