机器学习中的数学——常用概率分布（九）：经验分布（Empirical分布）

von Neumann

已于 2022-02-18 21:35:19 修改

阅读量1.7w

点赞数 6

分类专栏：机器学习中的数学文章标签：机器学习深度学习人工智能概率论经验分布

于 2021-10-04 18:09:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hy592070616/article/details/120605548

版权

机器学习中的数学专栏收录该内容

112 篇文章 896 订阅

订阅专栏

分类目录：《机器学习中的数学》总目录
相关文章：
· 常用概率分布（一）：伯努利分布（Bernoulli分布）
· 常用概率分布（二）：范畴分布（Multinoulli分布）
· 常用概率分布（三）：二项分布（Binomial分布）
· 常用概率分布（四）：均匀分布（Uniform分布）
· 常用概率分布（五）：高斯分布（Gaussian分布）/正态分布（Normal分布）
· 常用概率分布（六）：指数分布（Exponential分布）
· 常用概率分布（七）：拉普拉斯分布（Laplace分布）
· 常用概率分布（八）：狄拉克分布（Dirac分布）
· 常用概率分布（九）：经验分布（Empirical分布）
· 常用概率分布（十）：贝塔分布（Beta分布）
· 常用概率分布（十一）：狄利克雷分布（Dirichlet分布）
· 常用概率分布（十二）：逻辑斯谛分布（Logistic 分布）

《常用概率分布：狄拉克分布（Dirac分布）》中提到的狄拉克分布经常作为经验分布的一个组成部分出现：
$\hat{p}(x)=\frac{1}{m}\sum_{i=1}^m\delta(x-x_i)$

经验分布将概率密度 $\frac{1}{m}$ 赋给 $m$ 个点 $\cdots, x(m)$ 中的每一个，这些点是给定的数据集或者采样的集合。只有在定义连续型随机变量的经验分布时，Dirac delta函数才是必要的。对于离散型随机变量，情况更加简单：经验分布可以被定义成个Multinoulli分布，对于每一个可能的输入，其概率可以简单地设为在训练集上个输入值的经验频率。

当我们在训练集上训练模型时，我们可以认为从这个训练集上得到的经验分布指明了我们采样来源的分布。关于经验分布另外一种重要的观点是，它是训练数据的似然最大的那个概率密度函数。

关注

6
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

von Neumann 您的赞赏是我创作最大的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。