Python数据分析——Pandas基础入门+代码(三)之索引与切片

系列文章目录

Chapter 1:创建与探索DF、排序、子集化:Python数据分析——Pandas基础入门+代码(一)
Chapter 2:聚合函数,groupby,统计分析:Python数据分析——Pandas基础入门+代码(二)
Chapter 3:索引和切片:Python数据分析——Pandas基础入门+代码(三)
Chapter 4: 可视化与读写csv文件:Python数据分析——Pandas基础入门+代码(四)
Chapter 5:数据透视表:Python数据分析——Pandas基础入门+代码之数据透视表



前言

这一篇主要讲的是:

索引 Indexing 和 切片 Slicing

一开始会从索引开始说起,然后再讲解一下切片,这两部分包看包会。


一、索引

1.1 Index处理

设置与去除索引

这里主要用到的是两个methods,分别是:

  • 设置索引
  • 删除索引
# 表示以xxx为索引
set_index('xxx')

# 重置索引,如果又drop表示,会先重置索引再对刚刚索引的那列进行删除
reset_index(drop = True)

1.2 使用 .loc() 进行子集化

在这里插入图片描述

这里的翻译是:

  • 索引的杀手级功能是 .loc[]:一种接受索引值的子集方法。当您向其传递单个参数时,它将采用行的子集。
  • 使用 .loc[] 进行子集化的代码比标准的方括号子集化更容易阅读,这可以减少您的代码维护的负担。

说白了就是最好用.loc[]去找我们要的东西,这不仅方便索引,也方便我们阅读结果。同时,.loc()也能用于切片处理,这会在后面讲解。

For example, 下面的代码做了一个对比,得到的结果是一样的。

首先,给定一个城市的list
然后,利用isin()进行查找返回一个布林值,再要求pandas将布林值为True的找出来并打印
最后一行呢,是直接让loc去定位查找,包含了list中的数据,从而筛选出来并打印

# Make a list of cities to subset on
cities = ["Moscow", "Saint Petersburg"]
# Subset temperatures using square brackets
print(temperatures[temperatures["city"].isin(cities)])
# Subset temperatures_ind using .loc[]
print(temperatures_ind.loc[cities])

1.3 分层索引

在这里插入图片描述

分层索引的直接意思就是,可以一次索引多列,不想前面只索引了一列。分层索引的好处就是可以更好的推理嵌套分类变量。图中的例子就说对照组和实验组。

我们可以先看下原数据temperatures_ind 的前几行内容是什么样的:国家、城市、日期、平均温度
在这里插入图片描述
得到temperatures_ind 之后,我们建立一个元组,让loc去定位索引。

# Index temperatures by country & city
temperatures_ind = temperatures.set_index(['country'
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Pigou_

谢谢老板!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值