似然函数精彩理解集合

专业人士的操作是看维基百科https://en.wikipedia.org/wiki/Likelihood_function

感谢知乎的作者

1、似然与概率的区别

在英语语境里,likelihood 和 probability 的日常使用是可以互换的,都表示对机会 (chance) 的同义替代。但在数学中,probability 这一指代是有严格的定义的,即符合柯尔莫果洛夫公理 (Kolmogorov axioms) 的一种数学对象(换句话说,不是所有的可以用0到1之间的数所表示的对象都能称为概率),而 likelihood (function) 这一概念是由Fisher提出,他采用这个词,也是为了凸显他所要表述的数学对象既和 probability 有千丝万缕的联系,但又不完全一样的这一感觉。中文把它们一个翻译为概率一个翻译为似然也是独具匠心。

一种方便区别是概率还是似然的方法是,根据定义,"谁谁谁的概率"中谁谁谁只能是概率空间中的事件,换句话说,我们只能说,事件(发生)的概率是多少多少(因为事件具有概率结构从而刻画随机性,所以才能谈概率);而"谁谁谁的似然"中的谁谁谁只能是参数,比如说,参数等于 \theta时的似然是多少。

2、似然与概率的联系

先看似然函数的定义,它是给定联合样本值\textbf{x}下关于(未知)参数\theta 的函数:L(\theta | \textbf{x}) = f(\textbf{x} | \theta)

这里的小\textbf{x}是指联合样本随机变量\textbf{X}取到的值,即\textbf{X} = \textbf{x}

这里的\theta是指未知参数,它属于参数空间;

这里的f(\textbf{x}|\theta)是一个密度函数,特别地,它表示(给定)\theta下关于联合样本值\textbf{x}的联合密度函数。

 

所以从定义上,似然函数和密度函数是完全不同的两个数学对象:前者是关于\theta的函数,后者是关于\textbf{x}的函数。所以这里的等号= 理解为函数值形式的相等,而不是两个函数本身是同一函数(根据函数相等的定义,函数相等当且仅当定义域相等并且对应关系相等)。

说完两者的区别,再说两者的联系。

(1)如果\textbf{X}是离散的随机向量,那么其概率密度函数f(\textbf{x} | \theta)可改写为f(\textbf{x} | \theta) = \mathbb{P}_\theta(\textbf{X} = \textbf{x}),即代表了在参数\theta下随机向量\textbf{X}取到值\textbf{x}可能性;并且,如果我们发现

L(\theta_1 | \textbf{x} ) = \mathbb{P}_{\theta_1}(\textbf{X} = \textbf{x}) > \mathbb{P}_{\theta_2}(\textbf{X} = \textbf{x}) = L(\theta_2 | \textbf{x})

那么似然函数就反应出这样一个朴素推测:在参数\theta_1下随机向量\textbf{X}取到值\textbf{x}可能性大于 在参数\theta_2下随机向量\textbf{X}取到值\textbf{x}可能性。换句话说,我们更有理由相信(相对于\theta_2来说)\theta_1

更有可能是真实值。这里的可能性由概率来刻画。

综上,概率(密度)表达给定\theta下样本随机向量\textbf{X} = \textbf{x}可能性,而似然表达了给定样本\textbf{X} = \textbf{x}下参数\theta_1(相对于另外的参数\theta_2)为真实值的可能性。我们总是对随机变量的取值谈概率,而在非贝叶斯统计的角度下,参数是一个实数而非随机变量,所以我们一般不谈一个参数的概率

最后我们再回到L(\theta | \textbf{x}) = f(\textbf{x} | \theta)这个表达。首先我们严格记号,竖线|表示条件概率或者条件分布,分号;表示把参数隔开。所以这个式子的严格书写方式是L(\theta | \textbf{x}) = f(\textbf{x} ; \theta)因为\theta在右端只当作参数理解。



作者:Yeung Evan
链接:https://www.zhihu.com/question/54082000/answer/145495695
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

L(θ|x)=f(x|θ)
这个等式表示的是对于事件发生的两种角度的看法。其实等式两遍都是表示的这个事件发生的概率或者说可能性。再给定一个样本x后,我们去想这个样本出现的可能性到底是多大。统计学的观点始终是认为样本的出现是基于一个分布的。那么我们去假设这个分布为f,里面有参数theta。对于不同的theta,样本的分布不一样。f(x|θ)表示的就是在给定参数theta的情况下,x出现的可能性多大。L(θ|x)表示的是在给定样本x的时候,哪个参数theta使得x出现的可能性多大。所以其实这个等式要表示的核心意思都是在给一个theta和一个样本x的时候,整个事件发生的可能性多大。



作者:冯龙
链接:https://www.zhihu.com/question/54082000/answer/138115757
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值