python中pandas计数_python – 如何获得Pandas中groupby之后的列计数百分比

最新推荐文章于 2023-01-10 19:13:10 发布

weixin_39864591

最新推荐文章于 2023-01-10 19:13:10 发布

阅读量1.4k

点赞数

文章标签： python中pandas计数

本文链接：https://blog.csdn.net/weixin_39864591/article/details/111417222

版权

这篇博客展示了如何在Pandas DataFrame中，针对name和rank分组，计算grade的计数及其占每组的百分比。通过使用groupby、transform和除法操作，可以获取每个等级的计数以及它在组内所占的百分比。

摘要由CSDN通过智能技术生成

我正在尝试在数据列表中获取每个等级的等级分布.

但是,我无法弄清楚如何获得每个年级的比例/百分比超过其等级组.这是一个例子：

df.head()

name rank grade

Bob 1 A

Bob 1 B

Bob 1 C

Bob 2 B

Bob 3 C

Joe 1 C

Joe 2 B

Joe 3 A

Joe 3 B

我使用grade_count = df.groupby([‘name’,’rank’,’grade’]).[‘grade’].size())来给出其(名称,等级)组中每个年级的计数：

name rank grade

Bob 1 A 2

B 1

C 1

2 B 1

3 C 1

Joe 1 C 1

2 B 2

3 A 1

B 2

现在对于每个计算的大小,我想得到它与(名称,等级)组的比例(即系统内等级中等级的比例是多少)这是我想要的输出：

name rank grade

Bob 1 A 2 0.5 (Bob @ rank 1 had 4 grades, and 50% of them are A's)

B 1 0.25

C 1 0.25

2 B 1 1

3 C 1 1

Joe 1 C 1 1

2 B 2 1

3 A 1 0.33

B 2 0.66

我已经设法通过使用rank_totals = g

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39864591

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pandas使用教程：pandas计数count和索引设置set_index、reset_index

Cachel Wood的博客

07-20

902

导入excel数据表。

Python DataFrame数据分组统计（Pandas篇-16）

侯小啾技术博客

03-08

5651

Python Pandas DataFrame数据分组统计（第16讲）【`groupby()`&`agg()`】`groupby()` 函数是 Pandas 中用于分组数据的强大工具。它允许我们按照某一列或多个列的值对 DataFrame 进行分组，并对每个分组应用相应的函数。`agg()` 函数是 `Pandas` 中的一个灵活且功能强大的函数，用于对 `DataFrame` 或分组后的数据进行聚合操作。它允许我们一次性应用多个聚合函数或自定义函数，并返回一个包含聚合结果的新的 `DataFrame`。

参与评论您还未登录，请先登录后发表或查看评论

pandas显示百分数_pandas groupby和列中每个值出现的百分比

weixin_39771969的博客

02-08

1883

df['created_column'] = df.groupby('iv_5')['iv_5'].transform('size').div(len(df)).le(0.4).view('i1')print (df)iv_1 iv_2 iv_3 iv_4 iv_5 col2rplc created_column0 0 0 0 0 0 ...

python 计算百分比,如何在Python中的groupby中计算计数和百分比

weixin_42394054的博客

12-06

1093

I have following output after grouping byPublisher.groupby('Category')['Title'].count()CategoryCoding 5Hacking 7Java 1JavaScript 5LEGO 43Linux 7Net...

python累计占比_Python-pandas与groupby占总数的百分比

weixin_39966740的博客

12-09

1636

这显然很简单，但是作为一个笨拙的新手，我陷入了困境。我有一个包含3列的CSV文件，分别是该办公室的州，办公室ID和销售。我想计算给定状态下每个办公室的销售百分比(每个州的所有百分比的总和为100％)。df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3,'office_id': range(1, 7) * 2,'sales': [np.r...

pandas对每个分组分别统计百分比

景韦的专栏

09-12

2万+

数据如下： import numpy as np import pandas as pd np.random.seed(0) df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': list(range(1, 7)) * 2, 'sales': [np.random.randint(100000, 999999) for _ in range(12)]}) df=

python pandas 增加一列_在python pandas中添加组列的百分比

weixin_39785081的博客

12-17

1150

用groupby获得并用transform重塑的每个国家和球队的比赛数量之和除以数据帧。在df = pd.DataFrame({'country': ["NL"] * 9,'team': ["A"] * 3 + ["B"] * 3 + ["C"] * 3,'outcome': ["WIN", "LOSE", "DRAW"] * 3,'week1': [2, 3, 4, 4, 5, 2, 4, 4,...

Python Pandas Groupby教程

cumei1658的博客

07-15

9624

In this Pandas group by we are going to learn how to organize Pandasdataframes by groups. More specifically, we are going to learn how to group by one and multiple columns. Furthermore, we are going ...

Python数据分析——Pandas基础入门+代码（二）

pppgu‘s blog

03-30

1844

数据分析必备之pandas基础内容总结（2）。本篇主要是agg()，groupby和count，内含代码加实例。

pandas group by + rank 求在分组内的百分位、最接近某百分位的行

Michael是个半路程序员

01-10

1249

分组后，使用 rank。

python中agg求比率_python处理数据的风骚操作[pandas 之 groupby&agg]

weixin_39616693的博客

12-08

737

介绍每隔一段时间我都会去学习、回顾一下python中的新函数、新操作。这对于你后面的工作是有一定好处的。本文重点介绍了pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似，都是对数据集中的一类属性进行聚合操作，比如统计一个用户在每个月内的全部花销，统计某个属性的最大、最小、累和、平均等数值。其中，agg是pandas 0.20新引入的功能groupby &&a...

df.groupby()方法讲解

HTDiiii的博客

09-22

1万+

一些关于groupby的常用方法，代码，忘记的时候翻一翻

35. Pandas实现groupby聚合后不同列数据统计

lvlinjier的博客

02-19

2188

Pandas实现groupby聚合后不同列数据统计电影评分数据集（UserID，MovieID，Rating，Timestamp）聚合后单列-单指标统计：每个MovieID的平均评分 df.groupby(“MovieID”)[“Rating”].mean() 聚合后单列-多指标统计：每个MoiveID的最高评分、最低评分、平均评分 df.groupby(“MovieID”)[“Rating”].agg(mean=“mean”, max=“max”, min=np.min) df.groupby(“Mo

Pandas 分组占比

热门推荐

minixuezhen的博客

07-04

2万+

分组占比背景: 求每个用户做题的通过率：先算出用户总的做题数量，再算出用户通过的做题数量。 pandas的groupby用法 ## 总的数量 count_df = df.groupby('user_id')["if_pass"].count() test_df = pd.DataFrame(count_df) test_df = test_df.reset_index()...

Pandas分类总结之：分组

seven的博客

09-02

1966

文章目录1. 分组模式及其对象1.1 分组的一般模式1.2 Groupby对象1.3 分组的三大操作2.聚合函数2.1 内置聚合函数2.2 agg方法3.变换与过滤3.1 变换函数与transform方法3.2 组索引与过滤4.跨列分组4.1 apply函数 1. 分组模式及其对象 1.1 分组的一般模式 df.groupby(分组依据)[数据来源].使用操作实例df.groupby('Gender')['Height'].mean() 单一维度分组 df.groupby('Gender')['He

【python数据分析】分组聚合操作

The丶Star

05-09

5939

python数据分析——分组聚合操作

python groupby 输出站总体百分比

dudu3332的博客

11-02

2359

你将不得不创建第二个groupby对象，但是你可以以一种更简单的方式来计算百分比-仅groupby计算state_office并将该sales列除以其和即可。复制Paul H答案的开头： # From Paul H import numpy as np import pandas as pd np.random.seed(0) df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id':

python数据可视化之matplotlib精进pdf_Python数据可视化之matplotlib

weixin_39569753的博客

11-23

707

数据可视化能让人们更直观的传递数据所要表达的信息。Python 中有两个专用于可视化的库，matplotlib 和 seaborn ，本文将介绍matplotlib。Matplotlib：基于Python的绘图库，提供完全的 2D 支持和部分 3D 图像支持。Seaborn：该 Python 库能够创建富含信息量和美观的统计图形。Seaborn 基于 matplotlib，具有多种特性，比如内置主...

python 计算百分比_如何在Python中的groupby中计算计数和百分比

weixin_39846378的博客

12-06

1216

I have following output after grouping byPublisher.groupby('Category')['Title'].count()CategoryCoding 5Hacking 7Java 1JavaScript 5LEGO 43Linux 7Net...

python pandas模块_Python3.5 Pandas模块中Series用法详解