std()
函数用于计算 DataFrame 或 Series 中数值型数据的标准差。标准差是衡量数据集合中数据分散程度的一种统计量,它越大表示数据的波动越大,反之表示数据的波动越小。
下面是一个示例,说明如何使用 std()
函数:
import pandas as pd
# 创建一个 DataFrame
data = {
'A': [1, 2, 3, 4, 5],
'B': [4, 5, 6, 7, 8],
'C': [7, 8, 9, 10, 11]
}
df = pd.DataFrame(data)
# 计算整个 DataFrame 的标准差
total_std = df.std()
print("Total standard deviation of DataFrame:")
print(total_std)
# 计算每列的标准差
column_std = df.std(axis=0)
print("\nColumn standard deviation:")
print(column_std)
# 计算每行的标准差
row_std = df.std(axis=1)
print("\nRow standard deviation:")
print(row_std)
输出结果:
Total standard deviation of DataFrame:
A 1.581139
B 1.581139
C 1.581139
dtype: float64
Column standard deviation:
A 1.581139
B 1.581139
C 1.581139
dtype: float64
Row standard deviation:
0 3.0
1 3.0
2 3.0
3 3.0
4 3.0
dtype: float64
在这个示例中,我们首先创建了一个 DataFrame,并使用 std()
函数计算了整个 DataFrame 的标准差、每列的标准差以及每行的标准差。可以通过指定 axis
参数来沿着行或列进行计算标准差,默认情况下是对列进行计算标准差。