为什么可以用概率分布密度函数来表示概率？

TingXiao-Ul

已于 2022-04-22 18:34:01 修改

阅读量2k

点赞数 5

分类专栏：机器学习文章标签：机器学习

于 2022-04-21 13:14:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qingtianhaoshuai/article/details/124318819

版权

机器学习专栏收录该内容

19 篇文章

订阅专栏

为什么经常会看到随机变量的概率分布多用概率密度函数来描述而不直接用概率分布函数？

举个例子：现有如下数据集X，m个样本n个特征，y为标签向量集合，假设各维度遵循高斯分布

概率分布密度函数(高斯分布)如下所示，

这里的cov表示协方差矩阵， $\mu$ 为均值向量。我们经常会看到一些文章中的公式，如下所示

式中p(x)为全概率公式，如下所示：

可以看到，公式中“直接用概率分布密度函数来表示概率”，如下

这样表示对吗？要知道概率分布密度函数的值是可能大于1的。之所以这样做，一方面是因为概率的分布函数不好写出来，另一方面是因为过程省略了一些步骤，如下所示

$\varepsilon$ 是每个类的一个常量乘法因子，在之后的对后验概率 $p(\mathbf{y}_{k}|\textbf{x}_{i})$ 进行规范化的时候就抵消掉了。因此可以直接使用 $p(\mathbf{x}_{i}|\mathbf{y}_{k})=N(\mathbf{x}_{i}|\mu _{k},cov_{k})$ 来估计类条件概率 $p(\mathbf{x}_{i}|\mathbf{y}_{k})$ ，如下所示

首先，概率分布函数和概率分布密度函数是两个概念，并不能用概率分布密度函数直接来表示概率，即"质量"不能直接用“密度”来表达。你之所以会有“为什么可以用概率分布密度函数来表示概率”这种感觉，可能只是因为有些人少写了某些步骤而已。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。