机器学习中的数学——常用概率分布(九):经验分布(Empirical分布)

分类目录:《机器学习中的数学》总目录
相关文章:
· 常用概率分布(一):伯努利分布(Bernoulli分布)
· 常用概率分布(二):范畴分布(Multinoulli分布)
· 常用概率分布(三):二项分布(Binomial分布)
· 常用概率分布(四):均匀分布(Uniform分布)
· 常用概率分布(五):高斯分布(Gaussian分布)/正态分布(Normal分布)
· 常用概率分布(六):指数分布(Exponential分布)
· 常用概率分布(七): 拉普拉斯分布(Laplace分布)
· 常用概率分布(八):狄拉克分布(Dirac分布)
· 常用概率分布(九):经验分布(Empirical分布)
· 常用概率分布(十):贝塔分布(Beta分布)
· 常用概率分布(十一):狄利克雷分布(Dirichlet分布)
· 常用概率分布(十二):逻辑斯谛分布(Logistic 分布)


《常用概率分布:狄拉克分布(Dirac分布)》中提到的狄拉克分布经常作为 经验分布的一个组成部分出现:
p ^ ( x ) = 1 m ∑ i = 1 m δ ( x − x i ) \hat{p}(x)=\frac{1}{m}\sum_{i=1}^m\delta(x-x_i) p^(x)=m1i=1mδ(xxi)

经验分布将概率密度 1 m \frac{1}{m} m1赋给 m m m个点 x ( 1 ) , x ( 2 ) , ⋯   , x ( m ) x(1), x(2), \cdots, x(m) x(1),x(2),,x(m)中的每一个,这些点是给定的数据集或者采样的集合。只有在定义连续型随机变量的经验分布时,Dirac delta函数才是必要的。对于离散型随机变量,情况更加简单:经验分布可以被定义成个Multinoulli分布,对于每一个可能的输入,其概率可以简单地设为在训练集上个输入值的经验频率。

当我们在训练集上训练模型时,我们可以认为从这个训练集上得到的经验分布指明了我们采样来源的分布。关于经验分布另外一种重要的观点是,它是训练数据的似然最大的那个概率密度函数。

  • 6
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

von Neumann

您的赞赏是我创作最大的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值