Pandas的分层索引MultiIndex（十六）

最新推荐文章于 2023-07-07 20:24:32 发布

梦捷者

最新推荐文章于 2023-07-07 20:24:32 发布

阅读量381

点赞数 1

分类专栏： Pandas使用

本文链接：https://blog.csdn.net/qq_41706810/article/details/105964698

版权

Pandas使用专栏收录该内容

38 篇文章 12 订阅

订阅专栏

为什么要学习分层索引MultiIndex？

1、分层索引：在一个轴向上拥有多个索引层级，可以表达更高维度数据的形式；
2、可以更方便的进行数据筛选，如果有序则性能更好；
3、groupby等操作的结果，如果是多KEY，结果是分层索引，需要会使用
4、一般不需要自己创建分层索引(MultiIndex有构造函数但一般不用)

演示数据：百度、阿里巴巴、爱奇艺、京东四家公司的10天股票数据
数据来自：英为财经
https://cn.investing.com/

本次演示提纲：
一、Series的分层索引MultiIndex
二、Series有多层索引怎样筛选数据？
三、DataFrame的多层索引MultiIndex
四、DataFrame有多层索引怎样筛选数据？

前期导入相关包和数据

import pandas as pd
%matplotlib inline
stocks = pd.read_excel('./datas/stocks/互联网公司股票.xlsx')
stocks.shape
stocks["公司"].unique()
stocks.index
stocks.groupby('公司')["收盘"].mean()

一、Series的分层索引MultiIndex

#注意：多维索引中，空白的意思是：使用上面的值
ser = stocks.groupby(['公司', '日期'])['收盘'].mean()
ser.index #索引是一个元组
# unstack把二级索引变成列
ser.unstack()
ser.reset_index()#让列的索引不再是二级索引，使它变为自增的默认索引

二、Series有多层索引MultiIndex怎样筛选数据？

ser.loc['BIDU']

# 多层索引，可以用元组的形式筛选
ser.loc[('BIDU', '2019-10-02')]
ser.loc[:, '2019-10-02']

三、DataFrame的多层索引MultiIndex

stocks.set_index(['公司', '日期'], inplace=True) #让公司和日期变成index索引（二层索引）
stocks.sort_index(inplace=True)#按照索引来进行排序

四、DataFrame有多层索引MultiIndex怎样筛选数据？

【重要知识】在选择数据时：
（1）元组(key1,key2)代表筛选多层索引，其中key1是索引第一级，key2是第二级，比如key1=JD, key2=2019-10-02
（2）列表[key1,key2]代表同一层的多个KEY，其中key1和key2是并列的同级索引，比如key1=JD, key2=BIDU

stocks.loc['BIDU'] #查看BIDU这一行中的数据，列出所有列数据
stocks.loc[('BIDU', '2019-10-02'), :]#查找出二层索引相关的行数据，列全部显示
stocks.loc[('BIDU', '2019-10-02'), '开盘']
stocks.loc[['BIDU', 'JD'], :] #查看同级索引行数据
stocks.loc[(['BIDU', 'JD'], '2019-10-03'), :]
stocks.loc[(['BIDU', 'JD'], '2019-10-03'), '收盘']
stocks.loc[('BIDU', ['2019-10-02', '2019-10-03']), '收盘']
# slice(None)代表筛选这一索引的所有内容
stocks.loc[(slice(None), ['2019-10-02', '2019-10-03']), :]
stocks.reset_index()#使二级索引重新变为列colums

梦捷者

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Pandas的分层索引MultiIndex（十六）

为什么要学习分层索引MultiIndex？1、分层索引：在一个轴向上拥有多个索引层级，可以表达更高维度数据的形式；2、可以更方便的进行数据筛选，如果有序则性能更好；3、groupby等操作的结果，如果是多KEY，结果是分层索引，需要会使用4、一般不需要自己创建分层索引(MultiIndex有构造函数但一般不用)演示数据：百度、阿里巴巴、爱奇艺、京东四家公司的10天股票数据数据来自：...
复制链接

扫一扫