23北师大

大师兄统计

已于 2022-12-28 23:11:28 修改

阅读量704

点赞数 1

文章标签：概率论算法

于 2022-12-28 16:46:45 首次发布

本文链接：https://blog.csdn.net/weixin_63842959/article/details/128458764

版权

真题

一、单项选择题（每题3分，共18分）

已知 $P(A\cap B) = P(\bar{A}\cap \bar{B})$ , 且 $P (A) = p$ , 则 $P(B)=(\qquad)$ .
A. $p$
B. $1 - p$
C. $0$
D. $2 p$
已知 $\sim N(0,1), Y$ 以等概率取-1 和 $\cdot Z, X$ 与 $Y$ 独立, 下列错误的是 $(\qquad)$ .
A. $Z$ 服从标准正态
B. $X, Z$ 不相关
C. $X, Z$ 不独立
D. $(X, Z)$ 服从二维正态
$X, Y$ 独立服从同一种分布（参数不一定相同）, 且 $X + Y$ 也服从这种名称的分布, 则 $X, Y$ 的分布不可能是 $(\qquad )$ .
A. 正态
B. 二项
C. 指数
D. 泊松
$X\sim N(0,1)$ , $Y\sim \chi^2(m)$ , $Z\sim \chi^2(n)$ , 则正确的说法是 $(\qquad)$ .
A. $X^2\sim \chi^2(1)$
B. $\frac{X}{\sqrt{Y/m}}\sim t(m)$
C. $\frac{Y/m}{Z/n}\sim F(m,n)$
D. 都对
有来自 $\mathcal{P}(\lambda)$ 的 i.i.d. 样本 $X_1,\cdots,X_n$ , 则 $E(n\bar{X}^2+S^2)=(\qquad)$ .
A. $2\lambda$
B. $n\lambda^2+\lambda$
C. $\lambda+(n+1)\lambda^2$
D. $2\lambda + n\lambda^2$
有来自 $N(\mu,\sigma^2)$ 的 i.i.d. 样本 $X_1,\cdots,X_n$ , 记 $S_1^2$ 是 $\sigma^2$ 的MLE, $S_2^2$ 是样本方差, 则说法错误的是 $(\qquad)$ .
A. $S_2^2$ 是 $\sigma^2$ 的MLE
B. $S_1^2$ 的方差更小
C. $S_2^2$ 是 $\sigma^2$ 的无偏估计
D. $S_2$ 是 $\sigma$ 的有偏估计

二、填空题（每题3分，共30分）

甲乙丙独立做题，做对概率分别是 $1/3, 1/4, 1/5$ , 则至少有一人做对的概率是 $\underline{\qquad}$ .
已知 $\xi\sim U(0,5)$ , 则方程 $4x^2+4\xi x+(\xi+2)=0$ 有实根的概率是 $\underline{\qquad}$ .
已知 $X, Y, Z$ i.i.d. 服从 $N (0, 1)$ , 则 $E\left( \frac{X^2}{X^2+Y^2+Z^2} \right) =\underline{\qquad}$ .
设 $\bar{X},S^2$ 是样本均值和样本方差, 而 $\bar{X}^2-cS^2$ 是总体均值平方的无偏估计, 则 $c=\underline{\qquad}$ .
已知 $X, Y$ i.i.d. 服从 $N(\mu,\sigma^2)$ , 则 $a X + bY$ 和 $a X - bY$ 的相关系数是 $\underline{\qquad}$ .
已知 $X, Y$ 不相关, $X\sim B(1,p_1)$ , $Y\sim B(1,p_2)$ , 则 $E(X^2Y^2)=\underline{\qquad}$ .
某校学生身高近似服从标准差为 $6$ 的正态分布, 对该校男生身高进行置信水平为 $\%$ 的区间估计, 若要求误差 $d_0$ 不超过 1 , 则至少要调查的样本数为 $\underline{\qquad}$ .
设 $X_1,\cdots,X_n$ i.i.d. 服从 $U (0, 1)$ , 则 $E(X_{(n)})=\underline{\qquad}$ .
某设备发送 A.B 两种信号, 概率为 $1 : 2$ , 发射 A 信号但误接收为 B 的概率为 $0.02$ , 发射 $\mathrm{B}$ 信号对但接收为 $\mathrm{A}$ 的概率为 $0.01$ , 则在接收到 $\mathrm{A}$ 信号时发射 $\mathrm{A}$ 信号的概率为 $\underline{\qquad}$ .
某一零件正常工作概率 $0.95$ , 一个机器有 100 个零件, 至少 90 个零件正常工作则机器可正常运作, 问机器正常运作的概率为 $\underline{\qquad}$ .

三、分析计算题（共102分）

(20分) 简述两种图示方法, 分析 $X_1,X_2,\cdots,X_n$ 是否为正态分布.
(20分) 证明: $\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2=\frac{1}{2n(n-1)}\sum_{i=1}^n\sum_{j=1}^n(X_i-X_j)^2$ , 并说明统计学意义.
(20分) 有两组独立样本: $X_1,\cdots,X_n$ i.i.d. 服从 $N(\mu_1,\sigma^2)$ , $Y_1,\cdots,Y_m$ i.i.d. 服从 $N(\mu_2,\sigma^2)$ .
(1) 求 $\mu_1,\mu_2,\sigma^2$ 的MLE.
(2) 请构造 $H_0:\mu_1=\mu_2$ 的水平为 $\alpha$ 的拒绝域（备择假设是其对立）.
(3) 请构造 $H_0:\sigma^2=\sigma_0^2$ 的水平为 $\alpha$ 的拒绝域（备择假设是其对立）.
(20分) 已知 $X_1,\cdots,X_n$ i.i.d. 来自总体 $X\sim N(\mu,\sigma^2)$ , 任意 $i, j$ , $\mathrm{Corr}(X_i,X_j)=\rho$ .
(1) 求 $E(|X-\mu|)$ ;
(2) 求 $\mu$ 的矩估计;
(3) 证明: $\rho \ge -\frac{1}{n-1}$ .
(12分) 设 $F(y_1,y_2,\cdots,y_d)$ 为 $(Y_1,\cdots,Y_d)$ 的联合分布函数, 而 $F_i(y_i)$ 是边际分布. 证明:
$\left| F\left( x_1,\cdots ,x_d \right) -F\left( y_1,\cdots ,y_d \right) \right|\le \sum_{i=1}^d{\left| F\left( x_i \right) -F\left( y_i \right) \right|}.$
先证 $d = 2$ 时的情形, 再证明一般的情形.
(10分) 一元线性回归: $Y=\beta_0+\beta_1X+\varepsilon$ , $\hat{Y}=\hat{\beta}_0+\hat{\beta}_1X$ , 其中 $\hat{\beta}_0,\hat{\beta}_1$ 是最小二乘估计. 证明皮尔逊相关系数的平方 $r^2$ 与拟合优度 $R^2$ 等价. 注意:
$r=\frac{\sum\left(X_i-\bar{X}\right) \cdot\left(Y_i-\bar{Y}\right)}{\sqrt{\sum\left(X_i-\bar{X}\right)^2 \sum\left(Y_i-\bar{Y}\right)^2}},\quad R^2=\frac{\sum\left(\hat{Y}_i-\bar{Y}\right)^2}{\sum\left(Y_i-\bar{Y}\right)^2}.$

解析

一、单项选择题（每题3分，共18分）

已知 $P(A\cap B) = P(\bar{A}\cap \bar{B})$ , 且 $P (A) = p$ , 则 $P(B)=(\qquad)$ .
A. $p$
B. $1 - p$
C. $0$
D. $2 p$

Solution: 选 B.
利用德摩根公式, 有
$P(\bar{A} \bar{B})=1-P(A\cup B)=1-P(A)-P(B)+P(AB),$
解得 $P (B) = 1 - P (A) = 1 - p$ .

已知 $\sim N(0,1), Y$ 以等概率取-1 和 $\cdot Z, X$ 与 $Y$ 独立, 下列错误的是 $(\qquad)$ .
A. $Z$ 服从标准正态
B. $X, Z$ 不相关
C. $X, Z$ 不独立
D. $(X, Z)$ 服从二维正态

Solution: 选 D.

23考研模考题原题重现. 可以验证 $Z\sim N(0,1)$ , 且 $Cov\left( X,Z \right) =E\left( XZ \right) =E\left( X^2Y \right) =0$ , 但是
$\begin{aligned} P\left( X\le 1,Z\le 1 \right) &=P\left( X\le 1,XY\le 1 \right)\\ &=P\left( X\le 1,Y=1 \right) +P\left( -1\le X\le 1,Y=-1 \right)\\ &=\Phi \left( 1 \right) -\frac{1}{2}\Phi \left( -1 \right) ,\\ \end{aligned}$
不过 $P\left( X\le 1 \right) P\left( Z\le 1 \right) =\Phi ^2\left( 1 \right)$ , 它们不独立. 此外, 考虑 $X = x$ 时, $Z$ 只可能取 $\pm x$ , 因此它们不是联合正态. 因为如果它们是联合正态, 那条件分布也会是正态.

$X, Y$ 独立服从同一种分布（参数不一定相同）, 且 $X + Y$ 也服从这种名称的分布, 则 $X, Y$ 的分布不可能是 $(\qquad )$ .
A. 正态
B. 二项
C. 指数
D. 泊松

Solution: 选 C.
指数分布没有可加性, 即使它们参数一样时加在一起也是Gamma分布.

$X\sim N(0,1)$ , $Y\sim \chi^2(m)$ , $Z\sim \chi^2(n)$ , 则正确的说法是 $(\qquad)$ .
A. $X^2\sim \chi^2(1)$
B. $\frac{X}{\sqrt{Y/m}}\sim t(m)$
C. $\frac{Y/m}{Z/n}\sim F(m,n)$
D. 都对

Solution: 选 A.
如果没有强调独立性, 则 B,C 都不一定对.

有来自 $\mathcal{P}(\lambda)$ 的 i.i.d. 样本 $X_1,\cdots,X_n$ , 则 $E(n\bar{X}^2+S^2)=(\qquad)$ .
A. $2\lambda$
B. $n\lambda^2+\lambda$
C. $\lambda+(n+1)\lambda^2$
D. $2\lambda + n\lambda^2$

Solution: 选 D.
$E(\bar{X}^2) = \lambda^2 + \frac{\lambda}{n}$ , $E(S^2)=\lambda$ , 因此有
$E(n\bar{X}^2+S^2) = n\lambda^2 + 2\lambda.$

有来自 $N(\mu,\sigma^2)$ 的 i.i.d. 样本 $X_1,\cdots,X_n$ , 记 $S_1^2$ 是 $\sigma^2$ 的MLE, $S_2^2$ 是样本方差, 则说法错误的是 $(\qquad)$ .
A. $S_2^2$ 是 $\sigma^2$ 的MLE
B. $S_1^2$ 的方差更小
C. $S_2^2$ 是 $\sigma^2$ 的无偏估计
D. $S_2$ 是 $\sigma$ 的有偏估计

Solution: 选 A. 显然错误.

二、填空题（每题3分，共30分）

甲乙丙独立做题，做对概率分别是 $1/3, 1/4, 1/5$ , 则至少有一人做对的概率是 $\underline{\qquad}$ .

Solution: $\frac{3}{5}$ .
$p=1-\frac{2}{3}\cdot\frac{3}{4}\cdot\frac{4}{5}=\frac{3}{5}.$

已知 $\xi\sim U(0,5)$ , 则方程 $4x^2+4\xi x+(\xi+2)=0$ 有实根的概率是 $\underline{\qquad}$ .

Solution: $\frac{3}{5}$ .
判别式为 $\Delta = 16\xi^2 -16(\xi+2)=16(\xi ^2-\xi-2)=16(\xi+1)(\xi-2)$ , 令其 $\ge 0$ , 解得
$\{\Delta \ge 0\}= \{\xi\le -1\}\cup\{\xi\ge2\},$
故 $P(\Delta\ge 0)=P(\xi\ge 2)=\frac{3}{5}$ .

已知 $X, Y, Z$ i.i.d. 服从 $N (0, 1)$ , 则 $E\left( \frac{X^2}{X^2+Y^2+Z^2} \right) =\underline{\qquad}$ .

Solution: $\frac{1}{3}$ .

根据对称性, 有
$E\left( \frac{X^2}{X^2+Y^2+Z^2} \right) = E\left( \frac{Y^2}{X^2+Y^2+Z^2} \right) = E\left( \frac{Z^2}{X^2+Y^2+Z^2} \right),$
三者相加又是 $1$ , 故显然答案是 $\frac{1}{3}$ .

设 $\bar{X},S^2$ 是样本均值和样本方差, 而 $\bar{X}^2-cS^2$ 是总体均值平方的无偏估计, 则 $c=\underline{\qquad}$ .

Solution: $\frac{1}{n}$ .

$E(\bar{X}^2)=\mu^2+\frac{1}{n}\sigma^2$ , $E(S^2)=\sigma^2$ , 因此 $c=\frac{1}{n}$ .

已知 $X, Y$ i.i.d. 服从 $N(\mu,\sigma^2)$ , 则 $a X + bY$ 和 $a X - bY$ 的相关系数是 $\underline{\qquad}$ .

Solution: $\frac{a^2-b^2}{a^2+b^2}$ .

先求协方差, 有
$Cov(aX+bY,aX-bY)=a^2Var(X)-b^2Var(Y)=(a^2-b^2)\sigma^2,$
同时再算方差, 有
$Var(aX+bY)=Var(aX-bY)=(a^2+b^2)\sigma^2,$
故有 $\mathrm{Corr}(aX+bY,aX-bY)=\frac{a^2-b^2}{a^2+b^2}$ .

已知 $X, Y$ 不相关, $X\sim B(1,p_1)$ , $Y\sim B(1,p_2)$ , 则 $E(X^2Y^2)=\underline{\qquad}$ .

Solution: $p_1p_2$ .

由于两点分布不相关与独立等价, 故
$E(X^2Y^2)=E(X^2)E(Y^2)= p_1p_2.$

某校学生身高近似服从标准差为 $6$ 的正态分布, 对该校男生身高进行置信水平为 $\%$ 的区间估计, 若要求误差 $d_0$ 不超过 1 , 则至少要调查的样本数为 $\underline{\qquad}$ .

Solution: $139$ .

$95\%$ 置信区间为
$\left[ \bar{x}-1.96\frac{6}{\sqrt{n}},\bar{x}+1.96\frac{6}{\sqrt{n}} \right] ,$
令 $d_0=1.96\frac{6}{\sqrt{n}}\le 1$ , 解得 $\ge 138.298$ .

设 $X_1,\cdots,X_n$ i.i.d. 服从 $U (0, 1)$ , 则 $E(X_{(n)})=\underline{\qquad}$ .

Solution: $\frac{n}{n+1}$ .

利用结论: $X_{(n)}\sim Beta(n,1)$ , 我们有 $E(X_{(n)})=\frac{n}{n+1}$ .

某设备发送 A.B 两种信号, 概率为 $1 : 2$ , 发射 A 信号但误接收为 B 的概率为 $0.02$ , 发射 $\mathrm{B}$ 信号对但接收为 $\mathrm{A}$ 的概率为 $0.01$ , 则在接收到 $\mathrm{A}$ 信号时发射 $\mathrm{A}$ 信号的概率为 $\underline{\qquad}$ .

Solution: $0.98$ .

由贝叶斯公式, 有
$P\left( \mathrm{in}:A|\mathrm{out}:A \right) =\frac{\frac{1}{3}\cdot 0.98}{\frac{1}{3}\cdot 0.98+\frac{2}{3}\cdot 0.01}=0.98.$

某一零件正常工作概率 $0.95$ , 一个机器有 100 个零件, 至少 90 个零件正常工作则机器可正常运作, 问机器正常运作的概率为 $\underline{\qquad}$ .

Solution: $\Phi \left( 2.524 \right)$ .

设零件工作 $X_i =1$ , 不工作 $X_i=0$ , 则有 $X_i\sim B(1,0.95)$ , 因此有 $Y=\sum_{i=1}^{100} X_i \sim AN(95,4.75)$ , 故有
$P\left( \text{正常} \right) =P\left( Y\ge 90 \right) =P\left( Y>89.5 \right) =P\left( \frac{Y-95}{\sqrt{4.75}}>\frac{89.5-95}{\sqrt{4.75}} \right) =\Phi \left( 2.524 \right) .$

三、分析计算题（共102分）

(20分) 简述两种图示方法, 分析 $X_1,X_2,\cdots,X_n$ 是否为正态分布.

Solution: 可以用概率图（Probability-probability Plot，P-P图）、分位数图（Quantile-quantile Plot，Q-Q图）、直方图等来判断正态性。

P-P图是以样本的累计频率作为横坐标，以按照正态分布计算的相应累计概率作为纵坐标，把样本值表现为直角坐标系中的散点。如果数据服从正态分布，则样本点应该围绕第一象限的对角线分布。

Q-Q图则是以样本的分位数作为横坐标，以按照正态分布计算的相应分位数作为纵坐标，把样本表现为直角坐标系的散点。如果资料服从正态分布，则样本点应该呈一条围绕第一象限对角线的直线。

直方图指的是将数据以直方图的形式呈现，并将每个直方图顶部的中点连线，观察连线是否呈现中间高两边低且对称的钟形分布。

(20分) 证明: $\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2=\frac{1}{2n(n-1)}\sum_{i=1}^n\sum_{j=1}^n(X_i-X_j)^2$ , 并说明统计学意义.

Solution: 作恒等变形, 有
恒等变形.
$\begin{aligned} T:=\sum_{i=1}^n{\sum_{j=1}^n{\left( X_i-X_j \right) ^2}}&=\sum_{i=1}^n{\sum_{j=1}^n{\left( X_{i}^{2}+X_{j}^{2}-2X_iX_j \right)}}\\ &=\sum_{i=1}^n{\sum_{j=1}^n{\left( X_{i}^{2}+X_{j}^{2}-2X_iX_j \right)}}\\ &=\sum_{i=1}^n{\left( nX_{i}^{2}+\sum_{j=1}^n{X_{j}^{2}}-2nX_i\bar{X} \right)}\\ &=n\sum_{i=1}^n{X_{i}^{2}}+n\sum_{j=1}^n{X_{j}^{2}}-2n^2\bar{X}^2\\ &=2n\left( \sum_{i=1}^n{X_{i}^{2}-n\bar{X}^2} \right) ,\\ \end{aligned}$
因此看出
$T=\frac{\sum_{i=1}^n{X_{i}^{2}-n\bar{X}^2}}{n-1}=\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}=S^2.$

我们可以发现： $S^2$ 是样本方差，衡量数据的离散程度。而 $T$ 是两两样本之间距离平方的平均值，同样衡量数据的离散程度。

(20分) 有两组独立样本: $X_1,\cdots,X_n$ i.i.d. 服从 $N(\mu_1,\sigma^2)$ , $Y_1,\cdots,Y_m$ i.i.d. 服从 $N(\mu_2,\sigma^2)$ .
(1) 求 $\mu_1,\mu_2,\sigma^2$ 的MLE.
(2) 请构造 $H_0:\mu_1=\mu_2$ 的水平为 $\alpha$ 的拒绝域（备择假设是其对立）.
(3) 请构造 $H_0:\sigma^2=\sigma_0^2$ 的水平为 $\alpha$ 的拒绝域（备择假设是其对立）.

Solution: (1) 写出似然函数
$L\left( \mu _1,\mu _2,\sigma ^2 \right) =\left( 2\pi \sigma ^2 \right) ^{-\frac{m+n}{2}}\exp \left\{ -\frac{1}{2\sigma ^2}\left( \sum_{i=1}^n{\left( x_i-\mu _1 \right) ^2}+\sum_{i=1}^m{\left( y_i-\mu _2 \right) ^2} \right) \right\} ,$

对数似然函数是
$\ell \left( \mu _1,\mu _2,\sigma ^2 \right) =A-\frac{m+n}{2}\ln \left( \sigma ^2 \right) -\frac{1}{2\sigma ^2}\left( \sum_{i=1}^n{\left( x_i-\mu _1 \right) ^2}+\sum_{i=1}^m{\left( y_i-\mu _2 \right) ^2} \right).$
求导置零解得
$\hat{\mu}_1=\bar{x},\quad \hat{\mu}_2 = \bar{y},\quad \hat{\sigma}^2=\frac{1}{m+n}\left( \sum_{i=1}^n{\left( x_i-\bar{x} \right) ^2}+\sum_{i=1}^m{\left( y_i-\bar{y} \right) ^2} \right) .$

(2) 由于
$\frac{\left( \bar{x}-\bar{y} \right) -\left( \mu _1-\mu _2 \right)}{s_w\sqrt{\frac{1}{n}+\frac{1}{m}}}\sim t\left( m+n-2 \right) ,$
其中 $s_w^2$ 是联合样本方差, 即
$s_{w}^{2}=\frac{1}{m+n-2}\left( \sum_{i=1}^n{\left( x_i-\bar{x} \right) ^2}+\sum_{i=1}^m{\left( y_i-\bar{y} \right) ^2} \right),$
故在原假设成立时有检验统计量 $\frac{\bar{x}-\bar{y}}{s_w\sqrt{\frac{2}{n}}} \sim t(n-2)$ , 故拒绝域是
$W=\left\{ \left| \frac{\bar{x}-\bar{y}}{s_w\sqrt{\frac{1}{n}+\frac{1}{m}}} \right|>t_{1-\frac{\alpha}{2}}\left( m+n-2 \right) \right\} .$

(3) 利用 $\frac{(m+n-2)s_w^2}{\sigma^2} \sim \chi^(m+n-2)$ , 拒绝域是
$W=\left\{ \frac{\left( m+n-2 \right) s_{w}^{2}}{\sigma _{0}^{2}}<\chi _{\frac{\alpha}{2}}^{2}\left( m+n-2 \right) \right\} \cup \left\{ \frac{\left( m+n-2 \right) s_{w}^{2}}{\sigma _{0}^{2}}>\chi _{1-\frac{\alpha}{2}}^{2}\left( m+n-2 \right) \right\} .$

(20分) 已知 $X_1,\cdots,X_n$ i.i.d. 来自总体 $X\sim N(\mu,\sigma^2)$ , 任意 $i, j$ , $\mathrm{Corr}(X_i,X_j)=\rho$ .
(1) 求 $E(|X-\mu|)$ ;
(2) 求 $\mu$ 的矩估计;
(3) 证明: $\rho \ge -\frac{1}{n-1}$ .

Solution: (1) $|X-\mu|=\sigma |Z|$ , 其中 $Z\sim N(0,1)$ , 因此有
$E\left( |Z| \right) =\int_{-\infty}^{+\infty}{|z|\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}dz}=\sqrt{\frac{2}{\pi}}\int_0^{+\infty}{ze^{-\frac{z^2}{2}}dz}=\sqrt{\frac{2}{\pi}}\int_0^{+\infty}{e^{-u}du}=\sqrt{\frac{2}{\pi}}.$
故 $E(|X-\mu|)=\sigma \sqrt{\frac{2}{\pi}}$ .

(2) 总体期望 $\mu$ , 由替换原理, $\hat{\mu}=\bar{x}$ .

(3) 茆书原题, 利用相关系数矩阵的非负定性, 有
$\begin{aligned} \left| \begin{matrix} 1& \rho& \cdots& \rho\\ \rho& 1& \cdots& \rho\\ \vdots& \vdots& & \vdots\\ \rho& \rho& \cdots& 1\\ \end{matrix} \right|&=\left| \begin{matrix} 1+\left( n-1 \right) \rho& 1+\left( n-1 \right) \rho& \cdots& 1+\left( n-1 \right) \rho\\ \rho& 1& \cdots& \rho\\ \vdots& \vdots& & \vdots\\ \rho& \rho& \cdots& 1\\ \end{matrix} \right|\\ &=\left[ 1+\left( n-1 \right) \rho \right] \left| \begin{matrix} 1& 1& \cdots& 1\\ \rho& 1& \cdots& \rho\\ \vdots& \vdots& & \vdots\\ \rho& \rho& \cdots& 1\\ \end{matrix} \right|\\ &=\left[ 1+\left( n-1 \right) \rho \right] \left| \begin{matrix} 1& 0& \cdots& 0\\ \rho& 1-\rho& \cdots& 0\\ \vdots& \vdots& & \vdots\\ \rho& 0& \cdots& 1-\rho\\ \end{matrix} \right|\\ &=\left[ 1+\left( n-1 \right) \rho \right] \left( 1-\rho \right) ^{n-1}.\\ \end{aligned}$
如果 $\rho=1$ , 则相关系数矩阵的行列式为 0, 但也满足 $\rho \ge -\frac{1}{n-1}$ . 如果 $\rho<1$ , 那么 $(1-\rho)^{n-1}>0$ , 因此非负定要求了 $1+(n-1)\rho \ge 0$ , 故 $\rho\ge -\frac{1}{n-1}$ .

(12分) 设 $F(y_1,y_2,\cdots,y_d)$ 为 $(Y_1,\cdots,Y_d)$ 的联合分布函数, 而 $F_i(y_i)$ 是边际分布. 证明:
$\left| F\left( x_1,\cdots ,x_d \right) -F\left( y_1,\cdots ,y_d \right) \right|\le \sum_{i=1}^d{\left| F\left( x_i \right) -F\left( y_i \right) \right|}.$
先证 $d = 2$ 时的情形, 再证明一般的情形.

Solution: 这题23考研模考题押中原题. 先看 $d = 2$ , 简记 $x\land y =\min\{x,y\}$ , $x\lor y =\max\{x,y\}$ , 放缩, 有
$\begin{aligned} \left| F\left( x_1,x_2 \right) -F\left( y_1,y_2 \right) \right|&=\left| F\left( x_1,x_2 \right) -F\left( y_1,x_2 \right) +F\left( y_1,x_2 \right) -F\left( y_1,y_2 \right) \right|\\ &\le \left| F\left( x_1,x_2 \right) -F\left( y_1,x_2 \right) \right|+\left| F\left( y_1,x_2 \right) -F\left( y_1,y_2 \right) \right|\\ &=P\left( x_1\land y_1<Y_1\le x_1\lor y_1,Y_2\le x_2 \right) +P\left( Y_1\le y_1,x_2\land y_2<Y_1\le x_2\lor y_2 \right)\\ &\le P\left( x_1\land y_1<Y_1\le x_1\lor y_1 \right) +P\left( x_2\land y_2<Y_1\le x_2\lor y_2 \right)\\ &=\left| F_1\left( x_1 \right) -F_1\left( y_1 \right) \right|+\left| F_2\left( x_2 \right) -F_2\left( y_2 \right) \right|.\\ \end{aligned}$

而对于一般的 $d$ , 有
$\begin{aligned} \left| F\left( x_1,\cdots ,x_{d-1},x_d \right) -F\left( y_1,\cdots ,y_{d-1},y_d \right) \right|&=\left| F\left( x_1,\cdots ,x_{d-1},x_d \right) -F\left( y_1,\cdots ,y_{d-1},x_d \right) +F\left( y_1,\cdots ,y_{d-1},x_d \right) -F\left( y_1,\cdots ,y_{d-1},y_d \right) \right|\\ &\le \left| F\left( x_1,\cdots ,x_{d-1},x_d \right) -F\left( y_1,\cdots ,y_{d-1},x_d \right) \right|+\left| F\left( y_1,\cdots ,y_{d-1},x_d \right) -F\left( y_1,\cdots ,y_{d-1},y_d \right) \right|\\ &\le \left| F_{1,d-1}\left( x_1,\cdots ,x_{d-1} \right) -F_{1,d-1}\left( y_1,\cdots ,y_{d-1} \right) \right|+\left| F_d\left( x_d \right) -F_d\left( y_d \right) \right|,\\ \end{aligned}$
因此 $d - 1$ 时成立可推出 $d$ 时成立, 用归纳假设可以说明对一般的 $d$ 成立.

(10分) 一元线性回归: $Y=\beta_0+\beta_1X+\varepsilon$ , $\hat{Y}=\hat{\beta}_0+\hat{\beta}_1X$ , 其中 $\hat{\beta}_0,\hat{\beta}_1$ 是最小二乘估计. 证明皮尔逊相关系数的平方 $r^2$ 与拟合优度 $R^2$ 等价. 注意:
$r=\frac{\sum\left(X_i-\bar{X}\right) \cdot\left(Y_i-\bar{Y}\right)}{\sqrt{\sum\left(X_i-\bar{X}\right)^2 \sum\left(Y_i-\bar{Y}\right)^2}},\quad R^2=\frac{\sum\left(\hat{Y}_i-\bar{Y}\right)^2}{\sum\left(Y_i-\bar{Y}\right)^2}.$

Solution:
$r^2=\frac{l_{xy}^{2}}{l_{xx}l_{yy}}=\frac{\hat{\beta}_{1}^{2}l_{xx}}{l_{yy}}=\frac{\sum_{i=1}^n{\left[ \hat{\beta}_1\left( X_i-\bar{X} \right) \right] ^2}}{\sum_{i=1}^n{\left( Y_i-\bar{Y} \right) ^2}}=\frac{\sum_{i=1}^n{\left( \hat{Y}_i-\bar{Y} \right) ^2}}{\sum_{i=1}^n{\left( Y_i-\bar{Y} \right) ^2}}=R^2.$