使用numpy和pandas计算平均值、方差、标准差
numpy和pandas都可以实现计算平均值、方差、标准差。但numpy默认的是总体方差,pandas默认的样本方差,即分母是n-1,是总体的无偏估计。
1. numpy的语法
# numpy计算方法
import numpy as np
x = [1,2,3,4,5]
# mean
mean = np.mean(x)
# variation
var = np.var(x)
# stander var
std = np.std(x,ddof=1) #ddof=1 表示样本方差分母是n-1,无偏估计 doof=0 表示总体标准差
2.pandas的语法
#pandas计算方法
#axis = 0表示跨行,axis=1表示跨列
import pandas as pd
data_dic = {'c1' : [1,2,3],
'c2': [1,3,5]}
df = pd.DataFrame(data_dic)
#c1列的meam
mean = df['c1'].mean()
#or
mean = df.iloc[:,0].mean()
#c1列的var
var = df['c1'].var() #计算的无偏样本方差
var = df['c1'].values.var() #计算的是有偏的总体方差
#c1列的std
std = df['c1'].std()
std = df['c1'].values.std()