pandas rank 倒序_10个高效的Pandas函数,你都用过吗?

本文介绍了Pandas库中十个高效的数据分析函数,包括Query、Insert、Cumsum、Sample、Where、Isin、Loc和Iloc、Pct_change、Rank以及Melt。通过实例演示了如何使用这些函数进行数据过滤、插入新列、累加计算、随机抽样、按条件替换值、检查包含关系、选择行列、计算百分比变化、排名以及宽表转窄表等操作。
摘要由CSDN通过智能技术生成
b10196fa25294bfa2f66e27a896f189e.gif

Pandas是python中最主要的数据分析库之一,它提供了非常多的函数、方法,可以高效地处理并分析数据。让pandas如此受欢迎的原因是它简洁、灵活、功能强大的语法。

这篇文章将会配合实例,讲解10个重要的pandas函数。其中有一些很常用,相信你可能用到过。还有一些函数出现的频率没那么高,但它们同样是分析数据的得力帮手。

介绍这些函数之前,第一步先要导入pandas和numpy。

import numpy as np
import pandas as pd

1. Query

Query是pandas的过滤查询函数,使用布尔表达式来查询DataFrame的列,就是说按照列的规则进行过滤操作。

用法:

pandas.DataFrame.query(self, expr, inplace = False, **kwargs)

参数作用:

  • expr:要评估的查询字符串;
  • inplace=False:查询是应该修改数据还是返回修改后的副本
  • kwargs:dict关键字参数

首先生成一段df:

values_1 = np.random.randint(10, size=10)
values_2 = np.random.randint(10, size=10)
years = np.arange(2010,2020)
groups = ['A','A','B','A','B','B','C','A','C','C']
df = pd.DataFrame({ 'group':groups, 'year':years, 'value_1':values_1, 'value_2':values_2})
df
6dc2cc5cc4bbb041689798db7b069f1b.png

过滤查询用起来比较简单,比如要查列value_1<value_2的行记录:

df.query('value_1 )
e4da97854f11d3fe3dfaad14d76c458b.png

查询列year>=2016的行记录:

df.query('year >= 2016 ')
d4ed5be92b054bd14b788f76a30f2c13.png

2. Insert

Insert用于在DataFrame的指定位置中插入新的数据列。默认情况下新列是添加到末尾的,但可以更改位置参数,将新列添加到任何位置。

用法:

Dataframe.insert(loc, column, value, allow_duplicate
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值