数理统计——四大分布、置信区间

    在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信度(置信水平)。

问题:

一批零件长度服从\(N(\mu,\sigma^2)\)的正态分布,\(\mu,\sigma^2\)均为未知,现在随机抽取16个零件,\(\bar x=20(cm),S=1(cm)\),则\(\mu\)的置信度为0.90的置信区间为_________.

 

统计量:

为了某种目的人为制造的随机变量的函数.

常用统计量:

1、样本均值:\(\bar X={1\over n} \sum^n_{i=1}X_i\).
2、样本方差:\(S^2={1\over n-1}\sum^n_{i=1}(X_i-\bar X)^2 \).

 

统计量的分布——四大分布:

1、正态分布:

\(X\sim N(\mu,\sigma^2)\),    期望:\(EX=\mu\),    方差:\(DX=\sigma^2\),    标准化:\({X-\mu\over{\sigma^2}}\sim N(0,1)\).


2、\(\chi^2\)分布:

若\(X_1,X_2,...X_n\sim N(0,1)\),则
$$X=\sum^n_{i=1}X^2_i\sim \chi^2(n),自由度为n$$ $$EX=n,DX=2n$$

\(\chi^2\)分布标题


3、t分布(学生分布):

若\(X\sim N(0,1)\),若\(Y\sim \chi^2(n)\),且\(X,Y\)相互独立:
$$t={X\over\sqrt{Y\over n}}\sim t(n),自由度为n.$$

t分布


4、F分布:

若\(X\sim \chi^2(n_1)\),若\(Y\sim \chi^2(n_2)\),且\(X,Y\)相互独立:
$$F={{X/n_1}\over{Y/n_2}}\sim F(n_1,n_2)自由度n_1,n_2.$$

F分布

上\(\alpha\)分位数:

\(P(U\geq u_\alpha)=\alpha\),\(u_\alpha \)为上\(\alpha\)分位数.

通过查表可得到\(\alpha\)(概率密度函数的面积)对应的\(u_\alpha \)(分位值)的值.

上\(\alpha\)分位数

 

置信度(置信水平)、置信区间:

\(P(|\bar X-\mu|<\delta)=1-\alpha, 1-\alpha\)为置信度, \(\alpha\)为显著性水平,人为选取.

大样本情况下, 由中心极限定理可知:

不论\(X_i\mathrel{\mathop{\sim}\limits^{iid}}F(\mu,\sigma^2)(任意分布)\),有$$\sum^n_{i=1}X_i{\mathrel{\mathop{\sim}\limits^{n\to\infty}}}{N(n\mu,n\sigma^2)}$$

\(\bar X\)与\(S^2\)相互独立, 且\(E\bar X=\mu,D\bar X={1\over n}\sigma^2,ES^2=\sigma^2\).

下面就可以根据样本统计量得到关于被估计参数测量值的分布情况:

$$S^2={1\over {n-1}}\sum^n_{i=1}(X_i-\bar X)^2$$
$${(n-1)S^2\over \sigma^2}=\sum^n_{i=1}\left(X_i-\bar X\over{\sigma}\right)^2\sim\chi^2(n-1)$$
$${{\bar X-\mu}\over{S/\sqrt n}}={{{\bar X-\mu}\over{\sigma/n}}\over{S/\sigma}}={{{\bar X-\mu}\over{\sigma/\sqrt n}}\over{\sqrt{{{\left(n-1\right)S^2}/{\sigma^2}}\over{n-1}}}}\sim t(n-1).$$

到此, 得到了t分布, t分布为已知分布, 置信区间自然唾手可得:
$$P\left(\left|{{\bar X-\mu}\over{S/\sqrt n}}\right|<{\delta\over{S/\sqrt n}}\right)=1-\alpha$$
$$P(|t|<t_{\alpha\over 2}(n-1))=1-\alpha$$
$$\delta=t_{\alpha\over 2}(n-1)S/\sqrt n$$

样本均值\(\bar X=\mu\)的概率为0, 但\(\mu\)落在会以置信度\(1-\alpha\)为概率落在置信区间\((\bar X-\delta,\bar X+\delta)\)上.


特殊情况:

 \(\sigma^2\)已知(理想化条件, 一般为未知)则:

$${{\bar X-\mu}\over{\sigma/\sqrt n}}\sim N(0,1)$$

此时, 置信区间可根据正太分布计算.

在Matlab中,可以使用norminv函数来计算正态分布置信区间。该函数的语法是norminv(p, mu, sigma),其中p是置信水平,mu是均值,sigma是标准差。函数会返回一个置信区间的上下限。 例如,如果要计算正态分布的95%置信区间,可以使用以下代码: ```matlab alpha = 0.05; % 显著性水平为0.05 mu = 5; % 均值 sigma = 4; % 标准差 lower = norminv(alpha/2, mu, sigma); % 置信区间的下限 upper = norminv(1-alpha/2, mu, sigma); % 置信区间的上限 fprintf('置信区间为 \[%f, %f\]\n', lower, upper); ``` 这段代码会输出正态分布的95%置信区间。你可以根据需要修改alpha、mu和sigma的值来计算其他置信区间。 #### 引用[.reference_title] - *1* [MATLAB解决正态分布数据的大致方法](https://blog.csdn.net/yongheng_1999/article/details/50557486)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [matlab在概率论与数理统计中的应用](https://blog.csdn.net/m0_67790374/article/details/123343834)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值