在 Pandas 中,.groupby()
和 .sort_values()
是用于不同目的的两种操作。以下是它们的区别和用途:
.groupby()
.groupby()
用于将 DataFrame 按照某些列进行分组。分组后,你可以对每个组分别进行聚合、转换或其他操作。
用途:
- 计算每个组的聚合统计量(例如平均值、总和、计数等)。
- 应用函数到每个组。
- 执行数据分组和分段分析。
示例:
-
import pandas as pd
data = pd.DataFrame({
'Category': ['A', 'B', 'A', 'B', 'A', 'B'],
'Value': [10, 20, 30, 40, 50, 60]
})# 按 Category 分组,并计算每组的总和
grouped = data.groupby('Category').sum()
print(grouped)