import pandas as pd
#众数
df = pd.read_excel("./data/base_data.xlsx")
data = df[‘amount’]
print(‘众数为:’,data.mode().iloc[0]) #先取众数,iloc取行号(第一行)
#中位数
print(‘中位数为:’ ,data.median())
#分位数
print(‘下四位数为:’,np.percentile(data, 25))
print(‘上四位数为:’,np.percentile(data, 75))
#平均数
print(‘平均数为:’,data.mean())
#几何平均数
import math
s = 1
for i in data:
s *= i
print(‘几何平均数为:’,math.pow(s,1/len(data)))
#异众比率
modeCount = Counter(data).most_common(1)[0][1]
totalCount = len(data)
radio = (totalCount - modeCount) / len(data)
print(‘异众比率为:’,radio)
#四分位差
print(‘四分位差为:’, np.percentile(data, 75) - np.percentile(data, 25))
极差
print(‘极差为:’, data.max() - data.min())
平均差
meanData = data.mean()
s = 0
for i in data:
s += (abs(i - meanData))
print(‘平均差为:’, s/len(data))
方差
print(‘方差为:’, np.var(data))
标准差
print(‘标准差为:’, np.std(data))
#偏度
print(‘偏度为:’, stats.skew(data))
#峰度
print(‘峰度为:’, stats.kurtosis(data))