pandas入门——多重索引

最新推荐文章于 2023-09-28 11:10:12 发布

rthnfgxh

最新推荐文章于 2023-09-28 11:10:12 发布

阅读量2w

点赞数

分类专栏：数据挖掘之路文章标签： pandas

本文链接：https://blog.csdn.net/weixin_39501270/article/details/76832857

版权

数据挖掘之路专栏收录该内容

18 篇文章 0 订阅

订阅专栏

多重索引

设置多重索引

# 导入数据
import pandas as pd
import numpy
df1 = pd.read_csv(filepath_or_buffer="D://movie.csv")
df_new = df1.set_index(["country","director_name"],append=True,drop=False,inplace=True)

append参数的含义：append指定是否保留原索引，默认为False
drop参数的含义：drop是指该列被指定为索引后，是否删除该列，因为该列已经被指定为索引了。
inplace参数的含义：inplace是指是否修改原有数据集，默认为否是指返回一个新的数据集

索引排序

df_new.sort_index(inplace=True)

inplace参数的含义：inplace是指是否修改原有的数据集，默认返回一个新的数据集，不修改原有数据集
一般我们在对数据集按照列进行选取的时候，都应该对索引位进行排序，如果没有进行排序的话，会报警告。

使用loc对非数值索引进行选取

df_new.loc["USA",:]

loc函数可以基于索引名进行选取

使用切片函数结合loc函数进行选取

idx = pd.IndexSlice
df_new.loc[idx[:,:,:],:]
df_new.loc[idx["USA",:,[22.0,30.0]],:]

首先通过IndexSlice获取数据集的索引切片，然后可以基于此可以对多个列来进行选取。

rthnfgxh

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
pandas入门——多重索引

多重索引设置多重索引# 导入数据import pandas as pdimport numpydf1 = pd.read_csv(filepath_or_buffer="D://movie.csv")df_new = df1.set_index(["country","director_name"],append=True,drop=False,inplace=True)append参数
复制链接

扫一扫