pandas（五）索引对象

最新推荐文章于 2024-05-20 19:12:43 发布

白炎灵

最新推荐文章于 2024-05-20 19:12:43 发布

阅读量377

点赞数

分类专栏： python学习数据分析

本文链接：https://blog.csdn.net/weixin_43135165/article/details/102971342

版权

python学习同时被 2 个专栏收录

68 篇文章 3 订阅

订阅专栏

数据分析

25 篇文章 1 订阅

订阅专栏

这篇博文主要介绍索引对象。

文章目录

Index对象
MultiIndex对象

Index对象

一级索引对象

从Series对象中获得Index对象：

data = {
    "apples":2,
    "bananas":4,
    "oranges":9
}
s = pd.Series(data)
s
s.index

Out:
在这里插入图片描述
从DataFrame对象中获得Index对象：

data = {
    "apples":[2,3,4,5],
    "bananas":[1,5,2,3],
    "oranges":[9,4,6,3]
}
df = pd.DataFrame(data,index=["Lily","Tom","David","Robert"])
df
df.index
df.columns

Out:
在这里插入图片描述

创建索引对象

在Series中使用索引对象：

labels = pd.Index(["a","b","c","d"])
s = pd.Series(np.arange(4), index=labels)
s

Out:
在这里插入图片描述
在DataFrame中使用索引对象：

data = [[2,3,4],
        [1,5,2],
        [9,4,6],
        [12,4,15]]
row_labels = pd.Index(['Lily', 'Tom', 'David', 'Robert'])
column_labels = pd.Index(['apples', 'bananas', 'oranges'])
df = pd.DataFrame(data, index=row_labels, columns = column_labels)
df

Out:
在这里插入图片描述

重建索引

重建索引使用reindex()方法。
在Series对象中重建索引：

se1=pd.Series([1,7,3,9],index=['d','c','a','f'])
se1
se2=se1.reindex(['a','b','c','d','e','f'])
se2

Out:
在这里插入图片描述

在使用method参数的时候 index must be monotonic increasing or decreasing。

se3=pd.Series(["a", "b", "c"],index=[1,3,5])
se3
se4=se3.reindex(range(6),method='bfill')
se4

Out:
在这里插入图片描述

在DataFrame对象中重建索引：

df2 = df.reindex(['Tom', 'David', 'Robert'])
df2

Out:
在这里插入图片描述

df3 = df.reindex(columns=["oranges","bananas","apples"])
df3

Out:
在这里插入图片描述

MultiIndex对象

创建多级索引对象

#创建多级索引对象，pandas.MultiIndex.from_tuples从元组创建多级索引
pandas.MultiIndex.from_arrays#从数组
pandas.MultiIndex.from_product#从笛卡尔积
pandas.MultiIndex.from_frame#从数据框

keys = [("Lily","apples"),("Lily","bananas"),("Lily","oranges"),
        ("Tom","apples"),("Tom","bananas"),("Tom","oranges"),
        ("Pilph","apples"),("Pilph","bananas"),("Pilph","oranges")]
keys
index = pd.MultiIndex.from_tuples(keys,names=["names","fruits"])     
data=[1,2,3,13,45,2,3,4,7]
w = pd.Series(data,index=index)
w

Out:
在这里插入图片描述