【Python】pandas库中groupby()将列表作为分组键的用法解析

最新推荐文章于 2024-07-18 06:35:50 发布

qq_41081943

最新推荐文章于 2024-07-18 06:35:50 发布

阅读量292

点赞数 1

分类专栏： Python数据分析文章标签： pandas python 开发语言数据分析

本文链接：https://blog.csdn.net/qq_41081943/article/details/132220744

版权

Python数据分析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Python pandas库中groupby()将列表作为分组键的用法解析

GroupBy:对标签或索引的局部进行累计分析

groupby常用列名分割DataFrame，我们可以用 DataFrame 的groupby()方法进行绝大多数常见的分割 - 应用 - 组合操作，将需要分组的列名传进去即可：

df = pd.DataFrame({'key': ['A', 'B', 'C', 'A', 'B', 'C'],
'data': range(6)}, columns=['key', 'data']
print(df.groupby('key').sum())

groupby分组示例

设置分割的键

groupby()还可以将列表、数组、Series 或索引作为分组键。分组键可以是长度与 DataFrame 匹配的任意 Series 或列表，例如：
定义如下DataFrame:

rng = np.random.RandomState(0)
df = pd.DataFrame({'key': ['A', 'B', 'C', 'A', 'B', 'C'],
'data1': range(6),
'data2': rng.randint(0, 10, 6)},
columns = ['key', 'data1', 'data2'])

定义一个DataFrame

L = [0, 1, 0, 1, 2, 0]
print(df.groupby(L).sum())

因为列表的长度与DataFrame中的行数相同，这意味着：

计算流程如上图所示，结果将以列表L对应的元素作为索引对data1和data2进行分组求和。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_41081943

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python 的pandas库的使用示例

zhangzhechun的专栏

02-19

467

这些示例只是Pandas提供的功能的一小部分。Pandas还有许多其他有用的方法和功能，可以帮助您处理和分析数据。

Python实战 | 使用 Python 的日志库（logging）和 pandas 库对日志数据进行分析

Web3 & Basketball

11-08

4444

在 Python 中，实现日志收集和分析的方法有很多，这里我为您介绍一个简单的示例，使用 Python 的日志库（logging）和 pandas 库对日志数据进行分析。以上代码将模拟的日志数据保存到 CSV 文件，并使用 pandas 对其进行简单的统计和分析。这些日志记录将分别对应不同的日志级别，从低到高依次为：DEBUG、INFO、WARNING、ERROR、CRITICAL。4. 运行上述代码后，您将在当前目录下看到一个名为 app.log 的日志文件，其中包含了您刚刚记录的日志。

1 条评论您还未登录，请先登录后发表或查看评论

大数据之spark_spark的Transformation算子解析

WuBoooo的博客

09-17

413

map算子功能所做映射 val rdd1: RDD[Int] = sc.parallelize(List(5,6,4,7,3,8,2,9,1,10)).map(_*2) flatMap算子 先map在压平，spark中没有flatten方法 val rdd2 = sc.parallelize(Array("a b c", "d e f", "h i j")) rdd2.flatMap(_.split(' ')).collect val rdd3 = sc.parallelize(List(List("

groupby分组后去除多级索引

缘源园

02-21

5384

# 读取数据 flights = pd.read_csv('data/flights.csv') flights.head() MONTH DAY WEEKDAY AIRLINE ORG_AIR DEST_AIR SCHED_DEP DEP_DELAY AIR_TIME DIST SCHED_ARR ARR_DELAY DIVERTED CANCELLED 0 1 1 4 WN LA..

如何使用groupby函数对数据进行分组（1）

qq_28076755的博客

06-14

3842

转载自知乎：侦探L 如何使用groupby函数对数据进行分组（1） - 知乎在使用python进行数据分析的过程中，采用groupby函数对数据进行分组是一项很常用的操作，它可以帮助我们更清晰地了解我们所用数据的组成及规律，本节将为大家简单介绍一下如果使用groupby函数对数据进行分组的具体做法。总的来说，实现数据分组这一操作总共可以分成三步：split→apply→combine（1）第一步，split（分）。按照键值（key）或者分组变量将数据分组。（2）第二步，apply（用）。对于第一步分组后的数

pandas中关于DataFrame的groupby方法，如何取出分组的ID(行名称)和ID对应的个数

最新发布

kkchenjj的博客

07-18

695

Series是Pandas库中的一个基本数据结构，它类似于一维数组，可以存储任何数据类型（整数、字符串、浮点数、Python对象等）。Series由一组数据（数组）和与之相关的索引两部分构成。索引可以是任何数据类型，包括整数、字符串、日期等，这使得Series在处理数据时非常灵活。DataFrame是Pandas库中的另一个核心数据结构，它是一个表格型的数据结构，可以看作是由多个Series组成的二维数组。DataFrame可以存储不同类型的列，每一列可以有不同的数据类型。

Python-Pandas groupby后可应用函数全解析

qq_42209504的博客

07-01

2665

Python-Pandas groupby之后agg的函数最全groupby后可以应用agg或apply的函数说明1.shift和diff的应用假如你要根据A分组，计算B列的一阶差分，下面的用法是不对的，会导致分组的索引A列消失正确用法，先将需要分组的列设置为索引，然后上面level=0表示对索引进行分组，这样才会返回带分组列的正确信息2.cummax和cummin的理解，举个例子就懂了 groupby后可以应用agg或apply的函数函数解释 max 最大值 min 最小值 m

利用Python中的pandas库对cdn日志进行分析详解

09-21

### 利用Python中的pandas库对CDN日志进行分析详解 #### 前言随着互联网技术的发展，CDN（Content Delivery Network）作为一项提高网站访问速度的服务被广泛应用。CDN通过在全球范围内分布服务器节点，使得用户...

python dataframe 聚合groupby 选取每组的前几个/后几个字符串拼接变列表

Caiqiudan的博客

03-25

2984

需要每个客户的前三个购买最多次的品牌 a = od.groupby(['PID','品牌']).订单编号.count().reset_index() a = a.sort_values(['PID','订单编号'],ascending=False) # 先排好序 a = a.groupby('PID').head(3) # 每组的前三个品牌；后三个用tail函数 a = a.groupby('PID').品牌.agg(list) # 字符串合并为列表 ...

python dataframe group by_DataFrame的groupby

weixin_39952074的博客

12-08

587

#coding=utf-8import pandas as pdimport numpy as npdf=pd.read_csv("groupby.csv")print(df)'''company salary age0 A 13 401 A 49 182 C 15 163 B 40 494...

【随笔】dataframe中groupby其中一列，获取其他几列对应的list列表，最终生成dataframe

AI蜗牛车

07-22

1925

code 不废话直接看代码 import pandas as pd df = pd.DataFrame({ 'wo' : [11, 21, 31, 41, 21], 'niu': ['a', 'a', 'b', 'b', 'b'], 'che': [1 , 2, 3, 4, 5] }) niu_list = [] wo_list = [] che_list = [] for i in df.groupby('niu'): niu_list.append(i[0])

dataframe的groupby函数

jiangshandaiyou的博客

09-09

796

import numpy as np import pandas as pd df = pd.DataFrame([("bird", "Falconiformes", 389.0),("bird", "Psittaciformes", 24.0), ("mammal", "Carnivora", 80.2),("mammal", "Primates", np.nan),("mammal", "Carnivora", 58)], in

Python数据分析：pandas中Dataframe的groupby与索引

Machine Learning with Tutors

03-15

2万+

Series和DataFrame都是有索引的，索引的好处是快速定位，在涉及到两个Series或DataFrame时可以根据索引自动对齐，比如日期自动对齐，这样可以省去很多事。

dataframe groupby_pandas使用groupby分组后传入列的列表得到的还是原来所有列但加个函数后就只有列表里的列...

weixin_39723441的博客

11-27

832

import pandas as pd import numpy as np df = pd.DataFrame({'key1':list('aabba'),'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.rand(5)})先上代码，生成的df是：df.groupby('key1...

减肥零食排行榜

爱美

01-08

213

Pandas 模块-操纵数据(10)-数据分组 .groupby()

一分耕耘一分收获

12-19

5579

大家如果用过数据库，肯定对 group by 命令很熟悉，Pandas 的 .groupby() 函数作用和数据库中的 group by 非常相似。它会将 DataFrame 数据根据一定的规则进行分组，返回给用户一个 groupby 对象，这个对象包括了不同组的相关信息。

【Pandas 基础知识 GroupBy分组】

我的数据分析师之路

05-08

3923

图解Pandas 分组机制