.value_counts()跟.groupby()的区别

Jeroen Zeng

已于 2023-11-03 02:02:34 修改

阅读量171

点赞数

文章标签： python 开发语言

于 2023-11-03 00:53:00 首次发布

本文链接：https://blog.csdn.net/weixin_46264807/article/details/134194211

版权

在Pandas中，.value_counts()和.groupby()都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。

.value_counts()是一种用于计算Series中每个唯一值出现次数的函数1。例如，如果你有一个Series s，其中包含以下值

s = pd.Series(['a', 'b', 'a', 'c', 'b', 'a'])

那么s.value_counts()将返回以下结果：

a    3
b    2
c    1
dtype: int64

这表示'a'出现了3次，'b'出现了2次，'c'出现了1次。

另一方面，.groupby()是一种用于按照指定的列或索引级别对数据进行分组的函数 2。例如，如果你有一个DataFrame df，其中包含以下数据：

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
                   'C': np.random.randn(8),
                   'D': np.random.randn(8)})

那么你可以使用以下代码将数据按照列A进行分组：

grouped = df.groupby('A')

这将返回一个GroupBy对象，你可以使用它来对数据进行聚合操作。例如，你可以使用以下代码计算每个分组的平均值：

grouped.mean()

这将返回以下结果：

            C         D
A                      
bar -0.102949 -0.032087
foo -0.155270  0.045764

这表示'bar'分组的平均值为-0.102949和-0.032087，而'foo'分组的平均值为-0.155270和0.045764。

因此，.value_counts()和.groupby()都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。

Jeroen Zeng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
.value_counts()跟.groupby()的区别

value_counts()是一种用于计算Series中每个唯一值出现次数的函数1。例如，如果你有一个Series s，其中包含以下值。在Pandas中，.value_counts()和.groupby()都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。这将返回一个GroupBy对象，你可以使用它来对数据进行聚合操作。都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。分组的平均值为-0.102949和-0.032087，而。分组的平均值为-0.155270和0.045764。
复制链接

扫一扫