机器学习笔记(四)——最大似然估计

一、最大似然估计的基本思想

最大似然估计的基本思想是:从样本中随机抽取n个样本,而模型的参数估计量使得抽取的这n个样本的观测值的概率最大。最大似然估计是一个统计方法,它用来求一个样本集的概率密度函数的参数。

二、似然估计

在讲最小二乘法的时候,我们的例子是奥运会男子100m金牌所需要的时间,通过最小二乘法,我们求得了我们的模型参数。但是我们的模型目前预测的只是一个特定的值。实际上,所有的模型都有误差,也就是噪声。所以,我们需要思考如何产生与我们观察到的数据相似的数据。定义新的模型如下:

tn=ωTxn+εn

假设误差 ε 是独立的、连续的、而且服从正态分布。即上式满足:

εnN(0,σ2)

给高斯随机变量添加一个常量等同于具有相同常量转换来的均值的另一个高斯随机变量:

y=a+zp(z)=N(m,s)p(y)=N(m+a,s)

p(tn|xn,ω,σ2)=N(ωTxn,σ2) , 这里我们需要确定两个值: ω,σ2 的最优值。

对于给定的 ω,tn 是独立的,也就是说观测值是独立的。那么,整个数据集的似然值为:

L=p(t|xn,ω,σ2)=n=1Np(tn|xn,ω,σ2)=n=1NN(ωTxn,σ2)

最大化似然值即最大化似然对数,所以上式等价于求 wσ2 的最大似然解使得 logL 最大。
则通过求解:

logLω=0(1)logLσ=0(2)

求解的过程略过,得到 ωσ2^ 的最大似然解:

ω^=(XTX)1XTyσ2^=1N(tTttTXω^)

求解最大似然函数的一般步骤为:
1. 写出似然函数
2. 写出对数似然函数,并整理
3. 求导数
4. 解似然方程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值