今天给大家带来的这篇文章是关于机器学习的,机器学习有其独特的数学基础,我们用微积分来处理变化无限小的函数,并计算
它们的变化;我们使用线性代数来处理计算过程;我们还用概率论与统计学建模不确定性。
在这其中,概率论有其独特的地位,模型的预测结果、学习过程、学习目标都可以通过概率的角度来理解。
与此同时,从更细的角度来说,随机变量的概率分布也是我们必须理解的内容。在这篇文章中,项目作者介绍了所有你需要了解
的统计分布,他还提供了每一种分布的实现代码。
项目地址:https://github.com/graykode/distribution-is-all-you-need
下面让我们先看看总体上概率分布都有什么吧:
Python学习交流Q群:906715085###
非常有意思的是,上图每一种分布都是有联系的。比如说伯努利分布,它重复几次就是二项分布,如果再扩展到多类别,就成为
了多项式分布。注意,其中共轭(conjugate)表示的是互为共轭的概率分布;Multi-Class 表示随机变量多于 2 个;N Times 表示
我们还会考虑先验分布 P(X)。
在贝叶斯概念理论中,如果后验分布 p(θ | x) 与先验分布 p(θ) 是相同的概率分布族,那么后验分布可以称为共轭分布,先验分布
可以称为似然函数的共轭先验。
为了学习概率分布,项目作者建议我们查看 Bishop 的模式识别与机器学习。当然,你要是准备再过一遍《概率论与数理统计》,
那也是极好的。
概率分布与特性
1. 均匀分布(连续型)
均匀分布是指闭区间 [a, b] 内的随机变量,且每一个变量出现的概率是相同的。