机器学习中常见的概率知识

几个常见概率概念

先验概率:

事件发生前的预判概率。可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。贝叶斯中的先验概率一般特指P(y)

后验概率:

事件发生后求的反向条件概率;或者说,基于先验概率求得的反向条件概率。概率形式与条件概率相同。
P(y|x) 是后验概率,一般是我们求解的目标。

条件概率:

一个事件发生后另一个事件发生的概率。一般的形式为P(x|y)表示y发生的条件下x发生的概率。P(x|y) 是条件概率,又叫似然概率,一般是通过历史数据统计得到。一般不把它叫做先验概率,但从定义上也符合先验定义。

最大似然:

认为使得 P(x|y) P ( x | y ) 最大的 y y ,是当前 x 所属类别,即对所有的 y y ,求 maxP(x|y)=i=1Np(xi|y) y y

贝叶斯理论:

认为需要增加先验概率 P(y) ,因为有可能某个 y y 是很稀有的,即使 P(x|y) 很高,也很可能不是它。


概率分布函数/概率密度函数

概率函数:

就是用函数的形式来表达概率。概率函数一次只能表示一个取值的概率。比如 P(x=1)=16 P ( x = 1 ) = 1 6 ,这代表用概率函数的形式来表示,当随机变量取值为1的概率为1/6,一次只能代表一个随机变量的取值。

概率分布

aP(a)
10.5
00.5

概率分布函数

概率函数取值的累加结果,又叫累积概率函数

概率密度函数

连续型随机变量的“概率函数”,概率密度函数用数学公式表示就是一个定积分的函数,定积分在数学中是用来求面积的,把概率表示为面积即可
P(axb)=F(b)F(a)=baf(x)dx P ( a ≤ x ≤ b ) = F ( b ) − F ( a ) = ∫ a b f ( x ) d x
其中 F(x) F ( x ) 是概率分布函数, f(x) f ( x ) 是概率密度函数

独立和不相关
不相关事实上是线性独立,可能有其他函数关系,对于二维正态随机变量,不相关就是独立

相关系数
ρXY=Cov(X,Y)Var(X)Var(Y) ρ X Y = C o v ( X , Y ) V a r ( X ) V a r ( Y ) 相关系数是标准尺度下的协方差

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值