pandas python groupby_Python Pandas dataframe.groupby()用法及代码示例

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas dataframe.groupby()函数用于根据某些条件将数据分成几组。 Pandas 对象可以在任何轴上拆分。分组的抽象定义是提供标签到分组名称的映射。

用法: DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)

参数:

by:映射,函数,str或可迭代

axis:整数,默认0

level:如果轴是MultiIndex(分层),则按一个或多个特定级别分组

as_index:对于聚合输出,返回带有组标签的对象作为索引。仅与DataFrame输入有关。 as_index = False实际上是“SQL-style”分组输出

sort:排序组键。关闭此功能可获得更好的性能。请注意,这不会影响每个组中观察的顺序。 groupby保留每个组中行的顺序。

group_keys:调用apply时,将组键添加到索引以识别片段

squeeze:如果可能,请减小返回类型的维数,否则返回一致的类型

返回:GroupBy对象

有关在代码中使用的CSV文件的链接,请单击此处

范例1:采用groupby()函数根据“Team”对数据进行分组。

# importing pandas as pd

import pandas as pd

# Creating the dataframe

df = pd.read_csv("nba.csv")

# Print the dataframe

df

现在应用groupby()功能。

# applying groupby() function to

# group the data on team value.

gk = df.groupby('Team')

# Let's print the first entries

# in all the groups formed.

gk.first()

输出:

让我们打印包含组中任何一个的值。为此,请使用团队的名称。我们使用功能get_group()查找任何组中包含的条目。

# Finding the values contained in the "Boston Celtics" group

gk.get_group('Boston Celtics')

输出:

范例2:采用groupby()函数可根据一个以上的类别形成组(即使用多个列进行拆分)。

# importing pandas as pd

import pandas as pd

# Creating the dataframe

df = pd.read_csv("nba.csv")

# First grouping based on "Team"

# Within each team we are grouping based on "Position"

gkk = daf.groupby(['Team', 'Position'])

# Print the first value in each group

gkk.first()

输出:

groupby()是一个非常强大的功能,具有多种变体。这使得根据某些标准拆分数据帧的任务真正变得简单而高效。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值