统计学第九周-python实现参数估计

最新推荐文章于 2023-02-19 01:15:44 发布

笨鸟的GPS

最新推荐文章于 2023-02-19 01:15:44 发布

阅读量1.7k

点赞数

分类专栏：统计学

原文链接：https://blog.csdn.net/qq_43315928/article/details/103658733

版权

统计学专栏收录该内容

18 篇文章 3 订阅

订阅专栏

python实现参数估计

一、介绍

参数估计（parameter estimation）,统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看，区分为点估计与区间估计；从构造估计量的方法讲，有矩法估计、最小二乘估计、似然估计、贝叶斯估计。要处理两个问题：（1）求出未知参数的估计量；（2）在一定可信度（可靠程度）下指出所求的估计量的精度。信度一般用概率表示，如可信程度为95%；精度用估计量与被估参数（或待估参数）之间的接近程度或误差来度量

二、代码

1.导入数据

import pandas as pd
import numpy as np
from scipy import stats
path = "C:\\Users\\Administrator\\Desktop\\Notebook\\data.xlsx"
data = pd.read_excel(path)
age = data['Age']
age.mean()

在这里插入图片描述

# 抽取100个样本
age_sam = age.sample(100)
x1 = age_sam.mean()
age_sam.describe()

在这里插入图片描述
2.计算置信区间

pandas.std() 默认是除以n-1,无偏；加上参数ddof=0，即为有偏；DataFrame的describe()中就包含有std()；
numpy.std() 求标准差的时候默认是除以 n 的，即是有偏的，np.std无偏样本标准差方式为加入参数 ddof = 1

# 正态分布下的置信区间
def norm_conf (data,confidence=0.95):
    # https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html
    sample_mean = np.mean(data)
    sample_std = np.std(data,ddof=1)
    sample_size = len(data)
    conf_intveral = scipy.stats.norm.interval(confidence, loc=sample_mean, scale=sample_std)
    print(conf_intveral)

在这里插入图片描述

# T分布下的置信区间
def ttest_conf (data,confidence=0.95):
    sample_mean = np.mean(data)
    sample_std = np.std(data,ddof=1)
    sample_size = len(data)
    conf_intveral = scipy.stats.t.interval(confidence,df = (sample_size-1) , loc=sample_mean, scale=sample_std)
    print(conf_intveral)
    
ttest_conf(scale_means)

在这里插入图片描述
3.重复抽取数据

scale_means = []
for _ in range(1000):
   scale_sample = age.sample(100, replace=True)
   mean = scale_sample.mean()
   scale_means.append(mean)
norm_conf(scale_means)
ttest_conf(scale_means)

在这里插入图片描述

4.绘制数据

import seaborn as sns 
from matplotlib import pyplot as plt

sns.set_palette("hls") #设置所有图的颜色，使用hls色彩空间
sns.distplot(scale_means,color="r",bins=10,kde=True)
plt.title('Age')
plt.xlim(25,35)
plt.grid(True)
plt.show()

在这里插入图片描述
##############################################################
@ 2019.12.24 木居居士的统计学小组第九周打卡
安利公益监督学习组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q
感谢木东大佬、饼干大佬、南头大佬、星空妹砸、Desitiny、 DD-Kylin的无私付出，抱拳ing~

笨鸟的GPS

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
统计学第九周-python实现参数估计

python实现参数估计一、介绍参数估计（parameter estimation）,统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。从估计形式看，区分为点估计与区间估计；从构造估计量的方法讲，有矩法估计、最小二乘估计、似然估计、贝叶斯估计。要处理两个问题：（1）求出未知参数的估计量；（2）在一定可信度（可靠程度）下指出所求的估计量的精度。信度一般用概率表示，如可信程...
复制链接

扫一扫