概率论与数理统计C复习笔记(上)_Deng ZY的博客-CSDN博客https://blog.csdn.net/m0_63104232/article/details/130417506?spm=1001.2014.3001.5501"统计学三大分布"
1. 卡方分布
Y服从自由度为n的卡方分布:
2. t分布
Y服从自由度为n的t分布:
3. F分布
Y服从自由度为(m,n)的F分布:
随机变量的数字特征
1. 数学期望 (Expectation)
(1) 最简单的情况:
(2) 离散型随机变量:
(3) 连续型随机变量:
(4) 数学期望的性质:
(5) 条件数学期望:
(6) 全期望公式:
(7) 马尔可夫 (Markov) 不等式:
对任意随机变量X, 若E(X)存在, 则
通俗理解: 一个非负随机变量如果数学期望很小, 那么该随机变量取大值的概率也非常小.
2. 方差 (Variance)
(1) 定义:
(2) 计算公式:
(3) 方差的性质:
(4) 切比雪夫 (Chebyshev) 不等式:
对任意随机变量X, 若D(X)存在, 则
通俗理解: 如果一个随机变量的方差非常小, 那么该随机变量取远离数学期望的值的概率也非常小.
3. 常见随机变量的数学期望和方差
伯努利分布: | ||
二项分布: | ||
泊松分布: | ||
几何分布: | ||
均匀分布: | ||
正态分布: | ||
指数分布: |
4. 协方差 (Covariance) 与相关系数 (Correlation Coefficient)
(1) 协方差的定义:
(2) 计算公式:
(3) 协方差的性质:
(反之不一定成立)
(4) 相关系数的定义:
(5) 相关系数的性质:
(反之不一定成立)
(6) 对相关系数含义的解释:
相关系数又称"线性相关系数", 它并非刻画了X与Y之间"一般"关系的程度, 而只是"线性"关系的程度. 当且仅当X和Y有严格的线性关系时, 才有相关系数的绝对值达到最大值1. 即使X与Y有某种非线性的严格的函数关系, 相关系数不仅不必为±1, 还可以为0 (例如Y=cosX).
从"最小二乘法"的角度来解释线性相关和相关系数的含义: 设有两个随机变量X, Y, 用X的线性函数来逼近Y, 用"最小二乘法"求出的最佳线性逼近为
这一逼近的剩余是
.
如果, 则, , 此时Y与X有严格线性关系. 若, 则越接近1, 剩余越小, L(X)与Y的接近程度越大, X, Y之间线性关系的"程度"也越大; 反之, 越接近0, 二者的线性关系程度越小. 当时, X的线性作用已毫不存在. 当时, X与Y正向相关; 反之, 表示X与Y负向相关.
概率极限定理
1. 依概率收敛
依概率收敛于.
2. 以概率1 (或几乎处处) 收敛
以概率1 (或几乎处处) 收敛于.
3. 大数定律
(1) 弱大数定律:
通俗理解: 独立同分布的随机变量序列的样本均值, 在大样本的情况下 (n很大), 以很大的概率与随机变量的均值非常接近 (接近于).
重要特例——"伯努利大数定律" (即"频率收敛于概率"):
(2) 强大数定律:
弱大数定律只能保证对充分大的, 随机变量靠近, 但它不能保证也一定在的附近. 这样, 可以无限多次离开0 (尽管出现较大偏离的概率不会很高) .
而强大数定律能保证这种情况不会出现, 它能够以概率为1地保证, 只可能出现有限次.
4. 中心极限定理
概率论中最重要的理论之一. 它是指大量独立随机变量之和的分布可以近似为正态分布.
(1) 林德伯格—莱维 (Lindberg-Lévy) 定理:
(2) 棣莫弗—拉普拉斯 (De Moivre-Laplace) 定理:
此处, 故此定理是用正态分布去逼近二项分布, 与用泊松分布去逼近二项分布的应用不同: 正态分布逼近用于p固定, 因而当n很大时np很大的情况; 泊松分布逼近则用于p很小 (p随n变化以趋向于0) 但np=𝜆不太大时的情况. 二者的共同点是n必须相当大.
(3) 近似公式:
使用前提——n相当 (充分) 大
修正后近似效果更好的公式:
Author: Deng ZY
Date: May 12, 2023