机器学习基础-学习笔记概率论

最新推荐文章于 2021-09-08 21:12:03 发布

DLNU-linglian

最新推荐文章于 2021-09-08 21:12:03 发布

阅读量534

点赞数

分类专栏： MATLAB 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linglian0522/article/details/77075728

版权

MATLAB 专栏收录该内容

46 篇文章 6 订阅

订阅专栏

概率论

在机器学习的领域中，经常使用后验概率来实现执果索引的目的，常用的公式表述为：

P (X | Y) = P ( Y | X ) P ( X ) \sum X P ( Y | X ) P ( X )

$P(X | Y) = \frac{P(Y | X)P(X)}{\sum\limits_XP(Y|X)P(X)}$

P (Y) = \sum X P (Y | X) P (X

$P(Y) = \sum\limits_XP(Y|X)P(X$

其中，P(X | Y) 为随机事件Y发生的前提下，随机事件X发生的概率，也成为后验概率，P（X）为先验项或先验概率，P（Y | X）为似然项，P（Y）为随机变量Y的先验概率或边缘概率，也成为标准化常量。

参数估计

最大似然估计

针对模型已定，参数未知，提供了一种给定数据来评估模型参数的方法。

假设数据集 $x_1, x_2, \dots x_N$ 为独立同分布的采样，f为已知的模型（如服从高斯分布，拉普拉斯分布等）， $\theta$ 为模型的参数。

根据独立同分布的假设：

P (x 1, x 2, \dots x N | θ) = \prod i = 1 N P (x i | θ)

$P(x_1, x_2, \dots x_N | \theta) = \prod\limits_{i = 1}^N P(x_i | \theta)$

其似然函数的定义为：

L (θ | x 1, x 2, \dots x N) = \prod i = 1 N P (x i | θ)

$L(\theta | x_1, x_2, \dots x_N) = \prod\limits_{i = 1}^N P(x_i | \theta)$

参数 $\theta$ 的最大似然估计是通过最大化似然函数，使得求出的 $\theta$ 值与实际观察中的训练样本最相符，即

max θ L (θ | x 1, x 2, \dots x N)

$\max\limits_{\theta}{L(\theta | x_1, x_2, \dots x_N)}$

实际应用中，常利用最大化平均对数似然，即

θ * = a r g max θ \in θ l n ( L ( θ | x 1 , x 2 , \dots x N ) ) N = \sum i = 1 N l n ( P ( x i | θ ) ) N

$\theta^* = arg \max\limits_{\theta \in \theta} {\frac{ln(L(\theta | x_1, x_2, \dots x_N))}{N}} = \frac{\sum\limits_{i=1}^Nln(P(x_i | \theta))}{N}$

需要注意的是，最大似然估计只是参数估计的一种方法，通过若干次独立同分布的实验，观察其结果，利用结果推算出参数的大概值。

分类

对于分类问题也可以用最大似然估计来进行优化，考虑到计算问题，我们竟然使用最小化负对数似然损失函数，级 $\{x_i, j_i\}_{i=1}^N$ 。其中 $x_i \in R^n$ 为输入，输入目标为 $y_i \in \{ 1, 2, \dots, C \}$ ，学习模型为 $y = f(x, \theta)$ ，由于目标为离散的类别，所以通过计算输出每个类的条件概率来界定损失函数，即

f c (x, θ) = P (y = c | x, θ), c = 1, 2, \dots, C

$f_c(x, \theta) = P(y = c | x, \theta), c = 1, 2, \dots, C$

\sum c = 1 C f c (x, θ) = 1

$\sum\limits_{c = 1}^Cf_c(x, \theta) = 1$

f c (x, θ) \in [0, 1]

$f_c(x, \theta) \in [0, 1]$

得到的负对数似然函数为：

l (y, f (x, θ)) = - \sum c = 1 C y c l o g f c (x, θ)

$l(y, f(x, \theta)) = - \sum\limits_{c = 1}^Cy_clogf_c(x, \theta)$

进一步，最终的目标函数为：

max θ L (θ) = \sum i = 1 N l ( y i , f ( x i , θ ) ) N

$\max\limits_{\theta}{L(\theta) = \frac{\sum\limits_{i = 1}{N}l(y_i, f(x_i, \theta))}{N}}$

通常这种方法也被称为交叉熵损失函数

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础-学习笔记概率论

概率论在机器学习的领域中，经常使用后验概率来实现执果索引的目的，常用的公式表述为：P(X|Y)=P(Y|X)P(X)∑XP(Y|X)P(X) P(X | Y) = \frac{P(Y | X)P(X)}{\sum\limits_XP(Y|X)P(X)} P(Y)=∑XP(Y|X)P(X P(Y) = \sum\limits_XP(Y|X)P(X 其中，P(X | Y) 为随机事件Y发生的前提下，随机
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。