转载在:https://www.douban.com/note/640290683/
注0:《deep learning》的chapter 5有一部分讲maximum likelihood,那里讲地更清楚,建议直接去参考那里的内容。
注1:今天走在路上,突然想明白了似然度是怎么回事,它就是用来度量模型和数据之间的相似度,所以叫它似然度。
注2:原文链接:https://codesachin.wordpress.com/2016/07/24/the-basics-of-likelihood/
Defining the Likelihood Function
While assumes you know your model and tries to analyze data according to it, F2 keeps the data in perspective while figuring out how well different sets of parameters describe it.
概率,是你已经知道模型,去分析数据。
- 概率对象:真实对模拟
似然度,是你只知道数据,去模拟一个模型,分析模拟模型和数据(真实模型)的相似度。简单来说,似然度就是相似度,两个变量之间的相似度。
- 似然度:模拟对真实
There is a very, very important distinction between probability and likelihood functions – the value of the probability function sums (or integrates, for continuous data) to 1 over all possible values of the input data. However, the value of the likelihood function does not integrate to 1 over all possible combinations of the parameters.
概率的和为1,但是不能说似然度的和为一
The only thing you can be sure of, is this: If F2(θ1)>F2(θ2) , then it is more likely that denote the parameters of the underlying model.
我门只能通过似然度数值来说明模型与数值的拟合程度,似然度高,就说明模型越接近于数据真实的模型;即便似然度值为0.99,这页不能说明该似然模型最好,其他模型的似然度可能为0.999
问题:不能确定最大似然度,即不能确定最好的似然模型
原因:最大似然度值不能确定
解决:maximum likelihood estimate。通过求导,可以获得似然模型的极值,在求导过程中,用log来简化计算
扩展----在语音识别中,p(o|w)观察似然度,表示潜在句子与声学序列的相似度