python索引取值_对pandas的层次索引与取值的新方法详解

本文介绍了Python中Pandas的层次索引概念,包括Series和DataFrame的层次索引创建及操作,并详细阐述了层次索引下的数据统计方法。同时,文章对比了旧的ix取值方法和新的iloc、loc取值方式,通过实例展示了如何在Series和DataFrame中高效地进行数据访问。
摘要由CSDN通过智能技术生成

1、层次索引

1.1 定义

在某一个方向拥有多个(两个及两个以上)索引级别,就叫做层次索引。

通过层次化索引,pandas能够以较低维度形式处理高纬度的数据

通过层次化索引,可以按照层次统计数据

层次索引包括Series层次索引和DataFrame层次索引

1.2 Series的层次索引

import numpy as np

import pandas as pd

s1 = pd.Series(data=[99, 80, 76, 80, 99],

index=[['2017', '2017', '2018', '2018', '2018'], ['张伊曼', '张巧玲', '张诗诗', '张思思', '张可可']])

print(s1)

1.3 DataFrame的层次索引

# DataFrame的层次索引

df1 = pd.DataFrame({

'year': [2016, 2016, 2017, 2017, 2018],

'fruit': ['apple', 'banana', 'apple', 'banana', 'apple'],

'production': [10, 30, 20, 70, 100],

'profits': [40, 30, 60, 80,10],

})

print("df1===================================")

print(df1)

df2 = df1.set_index(['year', 'fruit'])

print("df2===================================")

print(df2)

print("df2.index===================================")

print(df2.index)

print("df2.sum(level='year')===================================")

print(df2.sum(level='year'))

print("df2.mean(level='fruit')===================================")

print(df2.mean(level='fruit'))

print("df2.sum(level=['year', 'fruit'])===================================")

print(df2.sum(level=['year', 'fruit']))

2、取值的新方法

ix是比较老的方法 新方式是使用iloc loc

iloc 对下标值进行操作 Series与DataFrame都可以操作

loc 对索引值进行操作 Series与DataFrame都可以操作

2.1 Series

# # 取值的新方法

s1 = pd.Series(data=[99, 80, 76, 80, 99],

index=[['2017', '2017', '2018', '2018', '2018'], ['张伊曼', '张巧玲', '张诗诗', '张思思', '张可可']])

print("s1=================================")

print(s1)

print("s1.iloc[2]=================================")

print(s1.iloc[2])

print("s1.loc['2018']['张思思']=================================")

print(s1.loc['2018']['张思思'])

2.2 DataFrame

df1 = pd.DataFrame({

'year': [2016, 2016, 2017, 2017, 2018],

'fruit': ['apple', 'banana', 'apple', 'banana', 'apple'],

'production': [10, 30, 20, 70, 100],

'profits': [40, 30, 60, 80,10],

})

print("df1===================================")

print(df1)

print("旧方法获取值===================================")

print("df1['year'][0]===================================")

print(df1['year'][0])

print("df1.ix[0]['year']===================================")

print(df1.ix[0]['year'])

print("新方法获取值===================================")

print("df1.iloc[0][3]===================================")

print(df1.iloc[0][3])

print("df1.loc[0]['year']===================================")

print(df1.loc[0]['year'])

以上这篇对pandas的层次索引与取值的新方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas 是一个强大的数据分析工具,提供了很多常用的函数来处理数据,下面是一些常用的函数及其用法: 1. read_csv():读取 CSV 文件并返回一个 DataFrame 对象。 2. head():返回 DataFrame 的前几行数据,默认为前 5 行。 3. tail():返回 DataFrame 的后几行数据,默认为后 5 行。 4. info():返回 DataFrame 的基本信息,包括每列的数据类型、非空数量等。 5. describe():返回 DataFrame 的基本统计信息,包括计数、均、标准差、最小、最大等。 6. shape:返回 DataFrame 的行数和列数。 7. columns:返回 DataFrame 的列名。 8. index:返回 DataFrame 的行索引。 9. loc[]:根据行标签和列标签访问 DataFrame 中的元素。 10. iloc[]:根据行索引和列索引访问 DataFrame 中的元素。 11. dropna():删除 DataFrame 中的缺失。 12. fillna():用指定的方法填充 DataFrame 中的缺失。 13. groupby():按照指定的列对 DataFrame 进行分组。 14. apply():对 DataFrame 的每一列应用指定的函数。 15. pivot_table():根据指定的列计算 DataFrame 的透视表。 16. merge():将两个 DataFrame 按照指定的列进行合并。 17. sort_values():按照指定的列对 DataFrame 进行排序。 18. drop_duplicates():去除 DataFrame 中的重复行。 19. value_counts():统计 DataFrame 中每个元素出现的次数。 20. isnull():判断 DataFrame 中的元素是否为空。 这些函数覆盖了 Pandas 中的很多常用操作,掌握它们对于数据分析和处理非常有帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值