quantile()
函数用于计算 DataFrame 或 Series 中数值型数据的分位数。分位数是将数据分为等分的数值点,常用的分位数包括中位数(50% 分位数)、四分位数(25% 分位数和 75% 分位数)等。
下面是一个示例,说明如何使用 quantile()
函数:
import pandas as pd
# 创建一个 DataFrame
data = {
'A': [1, 2, 3, 4, 5],
'B': [4, 5, 6, 7, 8],
'C': [7, 8, 9, 10, 11]
}
df = pd.DataFrame(data)
# 计算整个 DataFrame 的中位数(50% 分位数)
total_median = df.quantile(0.5)
print("Total median (50th percentile) of DataFrame:")
print(total_median)
# 计算每列的四分位数(25% 分位数和 75% 分位数)
column_quantile = df.quantile([0.25, 0.75])
print("\nColumn quartiles (25th and 75th percentiles):")
print(column_quantile)
# 计算每行的分位数(20% 分位数和 80% 分位数)
row_quantile = df.quantile([0.2, 0.8], axis=1)
print("\nRow quantiles (20th and 80th percentiles):")
print(row_quantile)
输出结果:
Total median (50th percentile) of DataFrame:
A 3.0
B 6.0
C 9.0
Name: 0.5, dtype: float64
Column quartiles (25th and 75th percentiles):
A B C
0.25 2.0 5.0 8.0
0.75 4.0 7.0 10.0
Row quantiles (20th and 80th percentiles):
0.2 0.8
0 1.4 6.6
1 2.6 7.4
2 3.8 8.2
3 4.6 9.4
4 5.4 9.8
在这个示例中,我们首先创建了一个 DataFrame,并使用 quantile()
函数计算了整个 DataFrame 的中位数(50% 分位数)、每列的四分位数(25% 分位数和 75% 分位数)以及每行的分位数(20% 分位数和 80% 分位数)。可以通过指定百分位数来计算不同分位数的值,也可以通过指定 axis
参数来沿着行或列进行计算,默认情况下是对列进行计算分位数。