ISLR_t统计量

最新推荐文章于 2021-08-22 22:26:05 发布

Young_Gy

最新推荐文章于 2021-08-22 22:26:05 发布

阅读量1.8k

点赞数

文章标签： islr

本文链接：https://blog.csdn.net/young_gy/article/details/49079715

版权

回顾
t分布的起源
t分布概述
inference for a mean
inference for comparing two independent means
inference for comparing two paired means

回顾

之前讲了Z统计量。
Z统计量的总体逻辑是：假设H0成立，建立群体均值的正态分布。正态分布的均值是总体均值，标准差是 $\sigma /\sqrt{n}$ ， $\sigma$ 一般用 $s$ 估计。这时候，根据样本的均值算出样本均值在群体均值正态分布的位置，如果位置很偏（p值很小，也就是取极限值的概率很小），那么就把H0拒绝了，因为从概率角度上，低概率事件可以默认为不可能事件，但是有一定的犯错概率，也就是Type 1 Error。

t分布的起源

大样本的好处
在obes独立不相关以及群体分布不是太skew的前提下，一个大的样本意味着

sample distribution of the mean 是正态的
估计的standard error更可信：sn√

sample样本越小，那么对standard error的估计就越不确信，因此相应的CI需要变得更宽一些，这就产生了T分布。

t分布概述

t分布的形状和自由度有关，自由度 $df$ 一般是 $df=n-1$ 。样本越大，t分布越接近正态分布。
样本越小，t分布越宽，这样解释了 $\sigma$ 的不确定性。

inference for a mean

inference for comparing two independent means

inference for comparing two paired means

比较paird means和independent means的区别有：
1. 前者的点估计是每个pair的差值的平均数，后者的点估计是每一组的平均数的差值
2. 前者的se是是pair的差值的 $s$ ，然后 $s/sqrt{n}$ ，后者的se是两组se的二范数。
3. 前者的假设是，后者的假设是组内和组件独立不相关，size/skew。

Young_Gy

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
ISLR_t统计量

t分布inference for a meaninference for comparing two independent meansinference for comparing two paired means
复制链接

扫一扫