概率与统计基本概念

最新推荐文章于 2023-12-31 01:48:30 发布

簌簌紫棠飞白鹭

最新推荐文章于 2023-12-31 01:48:30 发布

阅读量405

点赞数

文章标签：概率论机器学习

本文链接：https://blog.csdn.net/qq_43222996/article/details/120612352

版权

1.大数定理

1.1依概率收敛

[给出参考：依概率收敛_百度百科 (baidu.com)](https://baike.baidu.com/item/依概率收敛/1792875#:~:text=依概率收敛在概率论中，依概率收敛是随机变量收敛的方式之一。一个随机变量序列（Xn）n>%3D1 依概率收敛到某一个随机变量,X ，指的是 Xn 和 X 之间存在一定差距的可能性将会随着 n 的增大而趋向于零。)

依概率收敛在概率论中，依概率收敛是随机变量收敛的方式之一。一个随机变量序列（Xn）n>=1 依概率收敛到某一个随机变量 X ，指的是 Xn 和 X 之间存在一定差距的可能性将会随着n 的增大而趋向于零。

1.2弱大数定理

$如果存在{X_j}互不相关，所谓互不相关是指Cov(X_i,X_j)=0\\ 令均值μ_j=E(X_j),并且Var(X_j)≤C，即方差都是有界的\\ 则，对于随机变量的和\frac{1}{n}\sum_{j=1}^{n}(X_j-μ_j)依概率收敛到0\\ 换句话来说，\frac{1}{n}\sum_{j=1}^{n}(X_j)依概率收敛到μ$

1.3点点收敛

$P(\lim_{n->∞}X_n=X)=1$

1.4强大数定理

$如果存在{X_j}互不相关，所谓互不相关是指Cov(X_i,X_j)=0\\ 令均值μ_j=E(X_j),并且Var(X_j)≤C，即方差都是有界的\\ 换句话来说，\frac{1}{n}\sum_{j=1}^{n}(X_j)点点概率收敛到μ$

2.中心极限定理与特征函数

2.1依分布收敛

$X_j - F_j(x)\\ X - F(x)\\ 若满足\lim_{j->∞}=F(x),则称X_j依分布收敛到X\\ 定义特征函数\phi_X(t)=E(e^{itX}),其中i为复数\\ 对于依分布收敛的情况，可以找到特征函数的收敛与分布函数的收敛是一一对应\\$

特征函数的两个关键性质

$1.\phi^{(k)}(t)=i^kE(X^ke^{itX}),\\ 当t=0时，\phi^{(k)}(t)=i^kE(X^k),即为X的k阶矩\\ 2.若Y=X_i+...+X_n,则\phi_y(t)=\phi_{X_1}(t)*...*\phi_{X_n}(t)$

2.2中心极限定理

$如果存在{X_j}是iid的\\ 令均值μ_j=E(X_j),并且Var(X_j)≤C，即方差都是有界的\\ 则，利用特征函数\frac{1}{\sqrt n}\sum_{j=1}^{n}(X_j)的依分布收敛为N(0,1)正态分布\\ 具体证明需要的话可以评论区$

3.统计学基本概念

$通常把要检验的假设定义为H_0,和他对立的假设定义为H_1，通过样本情况对H_0进行检验\\ 所谓的检验就是根据样本值给出：接受H_0还是拒绝H_0\\ 其中定义拒绝H_0的集合为否定域w。$

在这里插入图片描述

通常采用功效函数法进行描述

$定义功效函数：ρ_w(θ)=P(reject\ H_0|θ),其中w为否定域，\\ 则可以定义:\\ 第一类概率错误：ρ_w(θ)，其中θ∈H_0；\\ 第二类概率错误：1-ρ_w(θ)，其中θ∈H_1；$

$一致最大功效（UMP）:\\ 若关于w的第一概率错误≤α，且第二类概率错误达到最小，就称之为一致最大功效\\$

$定义检验法中的无偏性：对于\forall θ∈H_1,均有ρ_w(θ)≥α\\ 上式描述的是，第一类错误概率不大于第二类错误概率$

上图通常我们简记为：

	True	False
Positive	TP	FP
Negative	TN	FN

在此基础上下面介绍两种曲线:
https://www.jianshu.com/p/ac46cb7e6f87

3.1PR（precision-recall）曲线

$precision=\frac{TP}{TP+FP}\\ recall=\frac{TP}{TP+FN}\\$

3.2ROC曲线

$横坐标FPR=\frac{FP}{FP+TN}\\ 纵坐标TPR=\frac{TP}{TP+FN}$

3.3P-Value

给出参考：浅谈p值（p-value是什么） - 简书 (jianshu.com)

给出参考：P值_百度百科 (baidu.com)

3.4线性回归与逻辑回归

给出参考：浅析机器学习：线性回归 & 逻辑回归 - 知乎 (zhihu.com)

4.极大似然估计

$已知X_1...X_n以及他们对应的Y_1...Y_n，假设他们符合参数为θ的模型。\\ 并且假定X_i，Y_i相互之间iid\\ 则可以定义P(X_i,Y_i|θ)\\ 在此基础上可以定义极大似然估计为，取值θ使得L(θ)=\prod_{i=1}^{n}P(X_i,Y_i|θ)取最大值\\ 记作θ_{MLE}=argmaxL(θ)$