渐进显著性学习笔记

最新推荐文章于 2024-07-11 10:30:06 发布

饕子

最新推荐文章于 2024-07-11 10:30:06 发布

阅读量2.2k

点赞数

分类专栏：概率与统计文章标签：学习笔记 python

本文链接：https://blog.csdn.net/m0_72410588/article/details/131102777

版权

概率与统计专栏收录该内容

97 篇文章

订阅专栏

文章探讨了渐进显著性在统计推断中的重要性，解释了中心极限定理如何保证样本均值的正态分布，以及大数定律如何确保样本均值逼近总体均值。通过Python和MATLAB代码示例，阐述了这两个定理在实际问题中的应用，并讨论了渐进显著性在实验设计、数据分析、假设检验和质量控制等领域的用途。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

渐进显著性学习笔记

渐进显著性是指在样本量足够大时，统计推断结果具有显著性的概率逐渐趋近于1或0。它是一种重要的统计概念，用于判断样本量是否足够大以对总体参数进行准确的估计和推断。

中心极限定理

中心极限定理表明，当样本量足够大时，样本均值的分布将近似于正态分布。这意味着，即使总体分布未知，我们仍然可以使用正态分布来进行推断。

下面是一个使用Python实现中心极限定理的代码示例：

import random
import math

def central_limit_theorem(n, m, s, num_samples):
    """
    中心极限定理模拟函数
    :param n: 样本量
    :param m: 总体均值
    :param s: 总体标准差
    :param num_samples: 抽样次数
    :return: 抽样得到的均值列表
    """
    sample_means = []
    for _ in range(num_samples):
        sample = [random.normalvariate(m, s) for _ in range(n)]
        sample_mean = sum(sample) / float(n)
        sample_means.append(sample_mean)

    return sample_means

# 总体均值、标准差和样本量
m = 50
s = 10
n = 50

# 抽样次数
num_samples = 10000

# 用中心极限定理模拟均值分布
sample_means = central_limit_theorem(n, m, s, num_samples)

# 计算抽样均值的平均值和标准差
mean_of_sample_means = sum(sample_means) / float(num_samples)
standard_deviation_of_sample_means = math.sqrt(sum([(x - mean_of_sample_means) ** 2 for x in sample_means]) / float(num_samples -1))

# 输出结果
print("总体均值：", m)
print("总体标准差：", s)
print("样本量：", n)
print("抽样次数：", num_samples)
print("抽样均值的平均值：", mean_of_sample_means)
print("抽样均值的标准差：", standard_deviation_of_sample_means)

这个代码根据输入的总体均值、标准差和样本量，在中心极限定理下抽样并计算均值分布的平均值和标准差。返回的结果显示，当样本量越大时，抽样均值的分布越趋近于正态分布。

大数定律

大数定律表明，当样本量足够大时，样本均值将收敛于总体均值。这意味着，随着样本量的增加，我们可以更准确地估计总体参数。

辛钦大数定律指出，当一个随机事件发生的概率非常小且事件的数量非常大时，该事件发生的频率接近于该事件的概率。下面是一个使用MATLAB实现辛钦大数定律的代码示例：

% 模拟辛钦大数定律
% 假设有10000个人，其中1个人得了某种罕见病，患病率为0.01%

n = 10000; % 总人数
p = 0.0001; % 罕见病患病率
num_experiments = 1000000; % 模拟实验次数

num_affected = 0; % 患病的人数

for i = 1:num_experiments
    % 随机选取一个人，若该人得病，则患病人数+1
    if rand <= p
        num_affected = num_affected + 1;
    end
end

% 患病人数的频率
observed_frequency = num_affected / num_experiments;

% 理论患病率
theoretical_probability = p;

% 输出结果
fprintf("患病率的频率：%f\n", observed_frequency);
fprintf("理论患病率：%f\n", theoretical_probability);

这个代码模拟了一个包含10000个人的群体，并假设其中有1个人患有罕见病，患病率为0.01%。然后，进行了1000000次随机实验，每次实验随机选取一个人，并计算最终患病的人数。通过观察患病人数的频率，可以发现其接近于理论患病率，证明了辛钦大数定律的正确性。

渐进显著性的应用

渐进显著性通常用于判断样本量是否足够大以进行统计推断。在做出决策之前，需要检查渐进显著性，以确保推断结果具有足够的准确性和可靠性。如果渐近显著性很低，则需要增加样本量以获得更准确的估计和推断。

渐进显著性（P-value）是一种用于检验假设的统计量，常用于研究领域。以下是一些渐进显著性的应用：

1.实验设计：在进行实验设计时，可以使用渐进显著性来确定实验结果的置信度。研究人员可以使用渐进显著性来确定是否拒绝或接受某个假设。

2.数据分析：在数据分析中，渐进显著性可以用来确定变量之间的关系以及是否有影响。例如，研究人员可以使用渐进显著性来确定某个药物是否对患者有治疗效果。

3.假设检验：假设检验是一种统计方法，用于测试假设是否正确。渐进显著性可以用来确定研究结果是否与假设一致。

4.质量控制：在制造和生产领域，渐进显著性可以用来确定产品或过程是否满足质量控制标准。研究人员可以使用渐进显著性来确定产品的质量是否符合标准。

总结

渐进显著性是在样本量足够大时，统计推断结果具有显著性的概率逐渐趋近于1或0的现象。中心极限定理表明，当样本量足够大时，样本均值的分布将近似于正态分布。大数定律表明，当样本量足够大时，样本均值将收敛于总体均值。渐进显著性通常用于判断样本量是否足够大以进行统计推断，并确保推断结果具有足够的准确性和可靠性。