Python数据处理之描述性统计(详尽)
描述性统计量:平均值,标准误差,中位数’,众数,标准差,方差,峰度,偏度,最小值,最大值,求和,观测数,第一四分位数,中位数,第三四分位数
import pandas as pd
import numpy as np
from scipy import stats
# # 导入数据
data = pd.read_excel("需要进行描述性统计的数据表格.xlsx")
des_index = ['平均值','标准误差','中位数','众数','标准差','方差','峰度','偏度','最小值','最大值','求和','观测数','第一四分位数','中位数','第三四分位数']
#需要进行描述性统计的变量名称
need_list = ['A', 'B', 'C']
df = pd.DataFrame(index=des_index, columns=need_list)
for col in need_list:
df[col] = [
np.mean(data[col]),# 平均值
stats.sem(data[col]),# 标准误差
np.median(data[col]),# 中位数
stats.mode(data[col]).mode[0],# 众数
np.std(data[col]), # 标准差
np.var(data[col]),# 方差
stats.kurtosis(data[col]), # 峰度
stats.skew(data[col]), # 偏度
np.min(data[col]),# 最小值
np.max(data[col]), # 最大值
np.sum(data[col]),# 求和
len(data[col]),# 观测数
np.percentile(data[col], 25),#上四分位数
np.percentile(data[col], 50),#中位数
np.percentile(data[col], 75)#下四分位数
]
#将描述性统计结果保存到excel中,并导出
df.to_excel('data_des.xlsx')
示例结果:
(还会持续更新一些计量经济学的基础知识点,可以点个关注哦~ 如果有关于计量经济学的问题欢迎交流~~~)