什么是概率和似然
1. 概率是在特定环境下,某件事情发生的可能性。在结果没有产生之前,我们可以根据环境中的参数,对某件事情发生的概率进行预测。
2. 似然和概率刚好相反,它是基于已经确定的结果来推测产生这个结果的可能环境,或者是推测环境中的某些参数。
因此,总结来说,似然和概率可以看作是问题的两个不同方向。概率是在已知模型参数的情况下预测结果,而似然是在已知结果的情况下推断模型参数。
数学表示
设θ表示环境中的参数,x表示事件发生的结果。那么概率可以表示为P(x|θ),也就是在环境参数为θ这个条件下,x发生的概率。
而似然为L(θ|x),即在已知观察结果是x的情况下,去推断θ。这里需要注意的是,P是关于x的函数,L是关于θ的函数。
极大似然估计
极大似然估计,Maximum Likelihood Estimate,也称为最大似然估计,就是利用已知的样本标记结果,反推最具有可能,或者最大概率导致这些样本结果出现的模型参数。极大似然估计是一种已知观察数据来推断模型参数的过程。例如,根据事件x的观察结果,推断θ是多少时,结果x最有可能发生,就是极大似然估计。
最大似然估计的总结
最大似然估计是一种参数估计方法,它的目标是找到最可能产生观察数据结果的参数值。在使用最大似然估计时,需要构建一个似然函数L(θ),并找到使这个函数取得最大时的参数值。
一般我们可以使用数学求导的方式,计算导数为0时,对应的参数取值,或者使用梯度下降算法,优化得到参数值。需要说明的是,最大似然估计的结果会受数据量的影响,更多的数据通常可以得到更准确的估计。
在机器学习算法中,比如逻辑回归模型,会根据已有的数据X,学习相应的参数分布,也就是计算θ,这其实就是最大似然估计的思想。
原文链接:什么是似然和极大似然估计 - 知乎