Pandas多层级索引的数据分析案例,超干货的!

本文通过实例讲解Pandas中多层级索引的数据筛选操作,包括按层级、范围和全量筛选,涉及`loc`、`iloc`、`query`等方法的使用。
摘要由CSDN通过智能技术生成

又是新的一周,最近上海的疫情似乎又开始严重起来了,小编所在的小区也被封了,身边很多包括同事、朋友所在的小区也都被封了。希望这个疫情可以尽快过去吧,生活能够重新回到正轨。今天我们来聊一下Pandas当中的数据集中带有多重索引的数据分析实战

通常我们接触比较多的是单层索引(左图),而多级索引也就意味着数据集当中的行索引有多个层级(右图),具体的如下图所示

AUTUMN

d58390e4c2db1c02445ead0e2457ce37.png

19e25ce2a5753b28e2fd06645f8902b0.png

导入数据

我们先导入数据与pandas模块,源数据获取,公众号后台回复【多重索引】就能拿到

import pandas as pd

## 导入数据集
df = pd.read_csv('dataset.csv')
df.head()

output

e88af21763e6407b653ad6abe3d1a2f4.png

该数据集描述的是英国部分城市在2019年7月1日至7月4日期间的全天天气状况,我们先来看一下当前的数据集的行索引有哪些?代码如下

df.index.names

output

FrozenList(['City', 'Date'])

数据集当中CityDate,这里的City我们可以当作是第一层级索引,而Date则是第二层级索引

我们也可以通过调用sort_index()方法来按照数据集的行索引来进行排序,代码如下

df_1 = df.sort_index()
df_1

output

a2eecfdff1db7c35a2348c703d90380c.png

要是我们想将这个多层索引去除掉,就调用reset_index()方法,代码如下

df.reset_index()

下面我们就开始针对多层索引来对数据集进行一些分析的

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值