23科大应统

大师兄统计

已于 2022-12-28 15:27:07 修改

阅读量401

点赞数

文章标签：概率论

于 2022-12-27 20:20:50 首次发布

本文链接：https://blog.csdn.net/weixin_63842959/article/details/128460052

版权

23科大专硕

一、填空题

投掷硬币 $n$ 次, 已知正面出现了 $k$ 次, 则前两次是正面的概率是 $\underline{\qquad}$ .

Solution: $\frac{k(k-1)}{n(n-1)}$ .

$\begin{aligned} P\left( X_1=1,X_2=1\left| \sum_{i=1}^n{X_i}=k \right. \right) &=\frac{P\left( X_1=1,X_2=1,\sum_{i=3}^n{X_i}=k-2 \right)}{C_{n}^{k}\left( \frac{1}{2} \right) ^n}\\ &=\frac{\frac{1}{2}\cdot \frac{1}{2}\cdot C_{n-2}^{k-2}\left( \frac{1}{2} \right) ^{n-2}}{C_{n}^{k}\left( \frac{1}{2} \right) ^n}=\frac{k\left( k-1 \right)}{n\left( n-1 \right)}.\\ \end{aligned}$

设有三角形 $A BC$ , 某人最开始站在 $A$ 点, 随机的向另外两个点走去, 随后每次如此, 问第 $n$ 次他走向 $A$ 点的概率是 $\underline{\qquad}$ .

Solution: $\frac{1}{3}\left( 1-\left( -\frac{1}{2} \right) ^n \right)$ .

考虑状态法, 设 $a_n,b_n,c_n$ 分别是它第 $n$ 次之后位于三点的概率, 有 $a_0=1,b_0=0,c_0=0$ , 以及 $a_1=0,b_1=\frac{1}{2},c_1=\frac{1}{2}$ . 显然所求概率应为 $p_n = \frac{1-a_{n-1}}{2}$ , 即它上一次之后不在 $A$ 点的概率, 再等分给他可以前往的两点.

用全概率公式有
$\begin{cases} a_{n+1}=0\cdot a_n+\frac{1}{2}\cdot b_n+\frac{1}{2}\cdot c_n,\\ b_{n+1}=\frac{1}{2}\cdot a_n+0\cdot b_n+\frac{1}{2}\cdot c_n,\\ a_{n+1}=\frac{1}{2}\cdot a_n+\frac{1}{2}\cdot b_n+0\cdot c_n,\\ \end{cases}\quad \Rightarrow \quad \left( \begin{array}{c} a_{n+1}\\ b_{n+1}\\ c_{n+1}\\ \end{array} \right) =\left( \begin{matrix} 0& \frac{1}{2}& \frac{1}{2}\\ \frac{1}{2}& 0& \frac{1}{2}\\ \frac{1}{2}& \frac{1}{2}& 0\\ \end{matrix} \right) \left( \begin{array}{c} a_n\\ b_n\\ c_n\\ \end{array} \right) ,$
可以用这个矩阵 $n$ 次方去算, 该方法称为马尔科夫链. 但是根据对称性, 我们知道 $b_n=c_n$ , 故 $b_n=c_n=\frac{1-a_n}{2}$ , 到最后只剩 $a_n$ 一个序列了, 我们反表示出 $a_n=1-2p_{n+1}$ , $b_n=c_n=p_{n+1}$ , 代入第一个全概率公式即为
$1-2p_{n+2}=p_{n+1},\quad \Rightarrow \quad p_{n+1}-\frac{1}{3}=-\frac{1}{2}\left( p_{n+1}-\frac{1}{3} \right) ,$
代入 $p_0=0$ , 解得
$p_n=\frac{1}{3}+\left( -\frac{1}{2} \right) ^n\left( 0-\frac{1}{3} \right) =\frac{1}{3}\left( 1-\left( -\frac{1}{2} \right) ^n \right) .$

已知将 $A, B, C$ 三个子母输入信道, 输出正确的概率是 $0.8$ , 输出为其他字母的概率是 $0.1, 0.1$ . 现在, 等概率地输入 $AAAA, BBBB, CCCC$ , 且观测到 $A CB A$ , 问输入是 $AAAA$ 的概率为 $\underline{\qquad}$ .

Solution: $0.8$ .

利用全概率公式得
$P\left( \mathrm{out}:ACBA \right) =\frac{1}{3}\cdot \left( 0.8^2\cdot 0.1^2 \right) +\frac{1}{3}\cdot \left( 0.1^3\cdot 0.8 \right) +\frac{1}{3}\cdot \left( 0.1^3\cdot 0.8 \right) =0.00266667,$
利用贝叶斯公式得
$P\left( \mathrm{in}:AAAA \right) =\frac{\frac{1}{3}\cdot \left( 0.8^2\cdot 0.1^2 \right)}{P\left( \mathrm{out}:ACBA \right)}=0.8.$

检验的 $p$ 值是否为统计量? $\underline{\qquad}$ .

Solution: 是.

$p$ 值依赖于观测到的样本, 属于统计量.

下列说法正确的个数是 $\underline{\qquad}$ .
(1) $R^2$ 越小说明方程的拟合越好;
(2) $R^2$ 越大说明方程的拟合越好;
(3) 残差 $e=\hat{y}-y$ 越大说明方程的拟合越好;
(4) 残差分析图中, 点的分布越平稳说明方程的拟合越好, 且点分布带状图越窄, 说明拟合精度越高.

Solution: 2.

(1) (3) 显然错误, (2) (4) 正确.

对任意三角形 $A BC$ 内部取一点 $P$ , 在 $BC$ 上取 $Q$ , 则直线 $PQ$ 与 $A B$ 相交的概率是 $\underline{\qquad}$ .
A. $\frac{1}{2}$
B. $\frac{|BC|}{|AB|+|BC|}$
C. $\frac{|BC|^2}{|AB|+|BC|}$
D. $\frac{|AB|+|AC|+\frac{|BC|}{2}}{|AB|+|AC|+|BC|}$ 不确定

Solution: A.

设三角形的边 $BC = a$ , $B$ 为原点, $BC$ 为 $x$ 轴, 则 $Q\sim U(0,a)$ , $P\sim U(\Delta ABC)$ . 先取定 $Q = (q, 0)$ , 连接 $A Q$ , $P$ 要落在 $\Delta ABQ$ 里才能满足题设条件, 故有
$\mathrm{Pr}\left( P\in \Delta ABQ|Q=q \right) =\frac{S_{\Delta ABQ}}{S_{\Delta ABC}}=\frac{q}{a},$
再让 $q$ 动起来, 有
$\mathrm{Pr}\left( PQ\cap AB \right) =\int_0^a{\frac{q}{a}\cdot \frac{1}{a}}dq=\frac{1}{2}.$

设 $X_1,\cdots,X_9$ 是 i.i.d. 的 $N (0, 1)$ 随机变量, 下列正确的是 $\underline{\qquad}$ .
A. $\frac{X_1^2+X_2^2+X_3^2}{X_4^2+\cdots+X_9^2}\sim F(3,6)$
B. $2\frac{X_1^2+X_2^2+X_3^2}{X_4^2+\cdots+X_9^2}\sim F(3,6)$
C. $\frac{X_1^2}{X_1^2+X_2^2} \sim F(1,2)$
D. $\frac{2X_1^2}{X_1^2+X_2^2} \sim F(1,2)$

Solution: B.

注意 C, D 并不满足分子分母的独立性.

已知 $X\sim \mathcal{P}(\lambda)$ , $Y\sim \mathcal{P}(\mu)$ , 且它们独立, 求 $E(X|X+Y=n)=\underline{\qquad}$ .

Solution: $\frac{\lambda n}{\lambda+\mu}$ .

$P\left( X=k|X+Y=n \right) =\frac{P\left( X=k,Y=n-k \right)}{P\left( X+Y=n \right)}=\frac{\frac{\lambda ^k}{k!}e^{-\lambda}\frac{\mu ^{n-k}}{\left( n-k \right) !}e^{-\mu}}{\frac{\left( \lambda +\mu \right) ^n}{n!}e^{-\left( \lambda +\mu \right)}}=C_{n}^{k}\left( \frac{\lambda}{\lambda +\mu} \right) ^k\left( \frac{\mu}{\lambda +\mu} \right) ^{n-k},$

因此 $X + Y = n$ 时, $X$ 的条件分布是 $B(n,\frac{\lambda}{\lambda +\mu})$ , 故期望是 $\frac{\lambda n}{\lambda+\mu}$ .

CLT，忘了，比较简单
忘了

二、计算分析题

(25分) 已知 $X\sim f(x)=\frac{1}{2}e^{-\frac{1}{2}x},x>0$ , $Y\sim U(0,1)$ , 且它们独立.
(1) 求联合密度 $f (x, y)$ ;
(2) 求 $Z = X + Y$ 的密度函数;
(3) 求 $t^2+2Xt+Y=0$ 有实根的概率, 保留 3 位小数.

Solution: (1) 根据独立性, 有
$f(x,y)=\frac{1}{2}e^{-\frac{1}{2}x},\quad x>0,\quad 0<1<y.$

(2) 作变量变换, 有
$\begin{cases} Z=X+Y,\\ W=Y,\\ \end{cases}\Rightarrow \begin{cases} z=x+y,\\ w=y,\\ \end{cases}\Rightarrow \begin{cases} x=z-w,\\ y=w,\\ \end{cases}\Rightarrow J=\left| \begin{matrix} 1& -1\\ 0& 1\\ \end{matrix} \right|=1,$
因此有
$f_{Z,W}\left( z,w \right) =f\left( z-w,w \right) =\frac{1}{2}e^{-\frac{z}{2}+\frac{w}{2}},\quad z>w,0<w<1,$
积掉 $W$ , 得
$f_Z\left( z \right) =\frac{1}{2}e^{-\frac{z}{2}}\int_0^{\min \left\{ z,1 \right\}}{e^{\frac{w}{2}}dw}=e^{-\frac{z}{2}}\left( e^{\frac{\min \left\{ z,1 \right\}}{2}}-1 \right) =\begin{cases} e^{-\frac{z}{2}}\left( e^{\frac{1}{2}}-1 \right) ,& z>1,\\ 1-e^{-\frac{z}{2}},& 0<z<1.\\ \end{cases}$

(3) $\Delta = 4X^2 -4Y$ , 故所求概率为 $P(X^2\ge Y)$ , 有
$P\left( X^2\ge Y \right) =\int_0^1{P\left( X\ge \sqrt{y} \right) f_Y\left( y \right) dy}=\int_0^1{e^{-\frac{\sqrt{y}}{2}}dy}=8\left( 1-\frac{3}{2}e^{-\frac{1}{2}} \right) =0.721632.$

(10分) 假设检验问题: 给出两组正态总体数据 $X, Y$ .
(1) 检验 $H_0:\sigma_1^2 =\sigma_2^2$ ;
(2) 检验 $H_0:\mu_1=\mu_2$ .

(25分) 有来自总体 $f(x,a)=\frac{2x}{a^2},0<x<a$ 的 i.i.d. 样本 $x_1,\cdots,x_n$ , 已知 $a > 1$ .
(1) 求 $a$ 的矩估计 $\hat{a}_1$ , 最大似然估计 $\hat{a}_2$ , 以及 $P(0<X<\sqrt{a})$ 的MLE;
(2) $\hat{a}_1$ , $\hat{a}_2$ 是否为无偏估计, 若不是请修正;
(3) 求 $n(a-\hat{a}_2)$ 在 $n\to \infty$ 的渐近分布.

Solution: (1) 求总体期望 $E (X)$ , 利用 $\frac{X}{a}\sim Beta(2,1)$ 或直接积分有 $E(X)=\frac{2}{3}a$ , 由替换原理, 得 $\hat{a}_1=\frac{3}{2}\bar{x}$ .

再写似然函数, 有
$L\left( a \right) =\frac{2^n\prod_{i=1}^n{x_i}}{a^{2n}},\quad a>\max \left\{ x_{\left( n \right)},1 \right\} ,$
可以看出似然函数关于 $a$ 递减, 故有
$\hat{a}_2=\max \{x_{(n)},1\}=\begin{cases} 1,& x_{\left( n \right)}<1,\\ x_{\left( n \right)},& x_{\left( n \right)}\ge 1.\\ \end{cases}$

(2) 由于 $E(\bar{x})=\frac{2}{3}a$ , 显然 $\hat{a}_1$ 无偏.

对于 $\hat{a}_2$ , 先求 $x_{(n)}$ 的分布, 有
$P\left( x_{\left( n \right)}\le t \right) =P^n\left( X\le t \right) =\left( \frac{t}{a} \right) ^{2n},\quad f_n\left( t \right) =\frac{2nt^{2n-1}}{a^{2n}},\quad 0<t<a,$
实际上即为 $\frac{x_{(n)}}{a}\sim Be(2n,1)$ , 故有
$E\left( \hat{a}_2 \right) =\int_0^1{f_n\left( t \right) dt}+\int_1^a{tf_n\left( t \right) dt}=\frac{1}{a^{2n}}+\frac{2n}{2n+1}\left( a-\frac{1}{a^{2n}} \right) =\frac{2n}{2n+1}\cdot a+\frac{1}{2n+1}\cdot \frac{1}{a^{2n}},$
由于 $a > 1$ , 故 $\frac{1}{a^{2n}}<1$ , 因此
$\frac{2n}{2n+1}\cdot a+\frac{1}{2n+1}\cdot \frac{1}{a^{2n}}<\frac{2n}{2n+1}\cdot a+\frac{1}{2n+1}<a.$
故 $\hat{a}_2$ 不无偏. 直接乘一个不含 $a$ 的数不可能修正为无偏估计, 但我们发现在求期望的过程中, 如果写成
$\int_0^1{f_n\left( t \right) dt}+\frac{2n+1}{2n}\int_1^a{tf_n\left( t \right) dt}=\frac{1}{a^{2n}}+\left( a-\frac{1}{a^{2n}} \right) =a,$
则恰好是无偏估计, 这对应的估计量是
$\tilde{a}_2=\begin{cases} 1,& x_{\left( n \right)}<1,\\ \frac{2n+1}{2n}x_{\left( n \right)},& x_{\left( n \right)}\ge 1.\\ \end{cases}$

(3) 记 $T_n = n(a-\hat{a}_2)$ , 则有
$P\left( T_n\le t \right) =P\left( n\left( a-\hat{a}_2 \right) \le t \right) =P\left( a-\hat{a}_2\le \frac{t}{n} \right) =P\left( \hat{a}_2\ge a-\frac{t}{n} \right) ,$
对于 $t > 0$ , 总有 $n$ 足够大使得 $a-\frac{t}{n}>1$ , 因此
$P\left( \hat{a}_2\ge a-\frac{t}{n} \right) =P\left( x_{\left( n \right)}\ge a-\frac{t}{n} \right) =1-\left( 1-\frac{t}{an} \right) ^{2n}\rightarrow 1-e^{-\frac{2t}{a}},\quad t>0,$
这说明 $n(a-\hat{a}_2)\xrightarrow{d}Exp(\frac{2}{a})$ .

(15分) 叙述题：(1) 叙述多重共线性的定义;
(2) 如何判断多重共线性：
(3) 如何消除多重共线性：
(4) 叙述自变量的选择标准.

Solution: (1) 在回归分析中，如果两个或两个以上自变量之间存在相关性，这种自变量之间的相关性，就称作多重共线性，也称作自变量间的相关性。多重共线性的存在违背了线性回归模型的基本假设，变量之间的线性相关性将会导致矩阵 $X^TX$ 不满秩，进而导致最小二乘估计不唯一。

(2) 可以借助方差膨胀因子 VIF 来判断共线性，计算公式是
$VIF_j = \frac{1}{1-R_j^2},$
一般我们认为 VIF > 10 时，存在多重共线性，该特征需要删除。

我们也可以分析矩阵 $X^TX$ 的特征值，如果该矩阵的最小特征值非常接近于 0，我们也认为存在多重共线性。

(3) 可利用逐步回归筛选并剔除引起多重共线性的变量，其具体步骤如下：先用被解释变量对每一个所考虑的解释变量做简单回归，然后以对被解释变量贡献最大的解释变量所对应的回归方程为基础，再逐步引入其余解释变量。经过逐步回归，使得最后保留在模型中的解释变量既是重要的，又没有严重多重共线性。

(4) 在模型中加入自变量时，要尽量使得：残差平方和缩小或决定系数增大，若某一自变量被引入模型后 SSE 减小很多，说明该变量对反映变量 $y$ 的作用大，可被引入；反之，说明其对 $y$ 的作用小，不应该被引入。此外，还可以根据赤池信息准则（AIC）、贝叶斯信息准则（BIC）、对数似然函数值（LLH）等方法判断。

(25分) 设有来自 $f(x;\lambda)=\lambda e^{-\lambda x}$ 指数分布的 i.i.d. 样本 $x_1,\cdots,x_n$ , 但由于某种原因只能观测到 $A_i=I_{\{a_i<x_i<b_i\}}$ , 其中 $a_i,b_i$ 是给定常数, $i=1,2,\cdots,n$ .
(1) 写出 $(A_1,\cdots,A_n)$ 对应的对数似然函数 $\ell_A(\lambda)$ , 同时写出完整样本 $(x_1,\cdots,x_n)$ 对应的对数似然函数 $\ell_X(\lambda)$ ;
(2) 写出基于 $\ell_A(\lambda)$ 所求 MLE 满足的等式;
(3) 分别考虑两个步骤:
(i) E 步: 考虑 $X\sim Exp(\lambda_k)$ , 求条件期望
$Q(\lambda|\lambda_k) = E[\ell_X(\lambda)|A,\lambda_k],$
(ii) M 步: 极大化 $Q(\lambda)$ , 即
$\lambda_{k+1} =\underset{\lambda}{\mathrm{argmax}} Q(\lambda|\lambda_k).$
(4) 证明: 通过两个步骤迭代得到的序列 $\lambda_n \to \hat{\lambda}$ , 其中 $\hat{\lambda}$ 是基于 $\ell_A(\lambda)$ 求得的 MLE. （提示：和 $a_i,b_i,\lambda_k,\lambda_0$ 有关）

Solution: (1) 每个 $A_i$ 都是两点分布, 其参数是
$p_i(\lambda) = P(a_i<x_i<b_i)= e^{-\lambda a_i}-e^{-\lambda b_i},$
因此有
$L_A\left( \lambda \right) =\prod_{i=1}^n{p_{i}^{A_i}\left( 1-p_i \right) ^{1-A_i}}=\prod_{i=1}^n{p_{i}^{A_i}}\cdot \prod_{i=1}^n{\left( 1-p_i \right) ^{1-A_i}},$
故有
$\ell _A\left( \lambda \right) =\sum_{i=1}^n{A_i\ln p_i}+\sum_{i=1}^n{\left( 1-A_i \right) \ln \left( 1-p_i \right)}.$

而全样本对应的对数似然函数是指数分布的联合密度取对数, 即
$\ell _X\left( \lambda \right) =n\ln \lambda -\lambda \sum_{i=1}^n{x_i}.$

(2) 记 $q_i(\lambda) = a_ie^{-\lambda a_i} - b_ie^{-\lambda b_i}$ , 实际上即 $q_i = -\frac{\partial p_i}{\partial \lambda}$ , 求导有
$\begin{aligned} \frac{\partial \ell _A}{\partial \lambda}&=\sum_{i=1}^n{A_i\frac{-q_i}{p_i}}+\sum_{i=1}^n{\left( 1-A_i \right) \frac{q_i}{1-p_i}}\\ &=-\sum_{i=1}^n{q_i\left( \frac{A_i}{p_i}-\frac{1-A_i}{1-p_i} \right)}=-\sum_{i=1}^n{q_i\frac{A_i-p_i}{p_i\left( 1-p_i \right)},}\\ \end{aligned}$
因此 MLE $\hat{\lambda}$ 满足
$\sum_{i=1}^n{q_i\left( \hat{\lambda} \right) \frac{A_i-p_i\left( \hat{\lambda} \right)}{p_i\left( \hat{\lambda} \right) \left( 1-p_i\left( \hat{\lambda} \right) \right)}}=0.$

(3) 先求 $E[x_k|A_k]$ , 有
$E\left[ x_i\mid A_i=1 \right] =\frac{E\left[ x_iI_{\left\{ a_i<x_i<b_i \right\}} \right]}{P\left( a_i<x_i<b_i \right)}=\frac{1}{\lambda}+\frac{q_i}{p_i},$
其中分子利用了
$\int_{a_i}^{b_i}{\lambda xe^{-\lambda x}dx}=\frac{1}{\lambda}\int_{\lambda a_i}^{\lambda b_i}{ue^{-u}du}=\frac{1}{\lambda}\left[ \left( \lambda a_i+1 \right) e^{-\lambda a_i}-\left( \lambda b_i+1 \right) e^{-\lambda b_i} \right] =q_i+\frac{p_i}{\lambda}.$
同理用 $E[x_iI_{\{x\notin (a_i,b_i)\}}]=E[x_i]-E[x_iI_{\{x_i\in(a_i,b_i)\}}]$ , 有
$E\left[ x_i\mid A_i=0 \right] =\frac{\frac{1-p_i}{\lambda}-q_i}{1-p_i}=\frac{1}{\lambda}-\frac{q_i}{1-p_i}.$

因此有 E 步是:
$\begin{aligned} Q\left( \lambda |\lambda _k \right) &=E\left[ \ell _X\left( \lambda \right) |A,\lambda _k \right]\\ &=n\ln \lambda -\lambda \sum_{i=1}^n{E\left[ x_i\mid A_i,\lambda _k \right]}\\ &=n\ln \lambda -\lambda \sum_{i=1}^n{\left( \frac{1}{\lambda _k}+q_i\left( \lambda _k \right) \left( \frac{A_i}{p_i\left( \lambda _k \right)}-\frac{1-A_i}{1-p_i\left( \lambda _k \right)} \right) \right)}\\ &=n\ln \lambda -\frac{n\lambda}{\lambda _k}-\lambda \sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)}.\\ \end{aligned}$

再考虑 M 步: 对 $Q(\lambda|\lambda_k)$ 求极大化（注意 $\lambda_k$ 是常数, 只有 $\lambda$ 是变量）, 可以求导得
$\frac{\partial Q}{\partial \lambda}=\frac{n}{\lambda}-\frac{n}{\lambda _k}-\sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)},$
解得极值点满足
$\frac{1}{\lambda}=\frac{1}{\lambda _k}+\frac{1}{n}\sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)},$
故有
$\lambda _{k+1}=\frac{1}{\frac{1}{\lambda _k}+\frac{1}{n}\sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)}}.$

(4) 该序列满足
$\frac{1}{\lambda _{k+1}}= \frac{1}{\lambda_k} + \frac{1}{n}\sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)},$
记 $D(\lambda_k) =- \sum_{i=1}^n{q_i\left( \lambda _k \right)}\frac{A_i-p_i\left( \lambda _k \right)}{p_i\left( \lambda _k \right) \left( 1-p_i\left( \lambda _k \right) \right)}$ , 这恰好是 $\ell_A$ 在 $\lambda_k$ 点的导数, 而
$\frac{1}{\lambda_{k+1}} = \frac{1}{\lambda_k} - \frac{1}{n} \cdot D(\lambda_k),$
该序列保证了 $\lambda_k$ 在导数的同方向迭代, 即保证了函数值 $\ell_A$ 的上升, 因此 $\{\lambda_n\}$ 一定收敛到 $\ell_A$ 的某个驻点, 即导数为 0 的点, 即 $\hat{\lambda}$ .