Python数据处理之描述性统计

Python数据处理之描述性统计(详尽)

描述性统计量:平均值,标准误差,中位数’,众数,标准差,方差,峰度,偏度,最小值,最大值,求和,观测数,第一四分位数,中位数,第三四分位数

import pandas as pd
import numpy as np
from scipy import stats

# # 导入数据
data = pd.read_excel("需要进行描述性统计的数据表格.xlsx")

des_index = ['平均值','标准误差','中位数','众数','标准差','方差','峰度','偏度','最小值','最大值','求和','观测数','第一四分位数','中位数','第三四分位数']

#需要进行描述性统计的变量名称
need_list = ['A', 'B', 'C']
df = pd.DataFrame(index=des_index, columns=need_list)

for col in need_list:
    df[col] = [
        np.mean(data[col]),# 平均值
        stats.sem(data[col]),# 标准误差
        np.median(data[col]),# 中位数
        stats.mode(data[col]).mode[0],# 众数
        np.std(data[col]), # 标准差
        np.var(data[col]),# 方差
        stats.kurtosis(data[col]), # 峰度
        stats.skew(data[col]),  # 偏度
        np.min(data[col]),# 最小值
        np.max(data[col]), # 最大值
        np.sum(data[col]),# 求和
        len(data[col]),# 观测数
        np.percentile(data[col], 25),#上四分位数
        np.percentile(data[col], 50),#中位数
        np.percentile(data[col], 75)#下四分位数
    ]

#将描述性统计结果保存到excel中,并导出
df.to_excel('data_des.xlsx')

示例结果:
Alt

(还会持续更新一些计量经济学的基础知识点,可以点个关注哦~ 如果有关于计量经济学的问题欢迎交流~~~)

  • 8
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值