最小二乘法和最大似然估计

本文介绍了最小二乘法和极大似然估计在机器学习中的应用。最小二乘法通过求导找到参数,使得观测点与估计点的平方和最小,适合线性回归中的参数估计。极大似然估计则寻找使样本观测值出现概率最大的参数估计量,尤其在正态分布假设下,与最小二乘估计等价。两者在统计学中分别用于不同目的,最大似然估计需要已知概率分布函数,而最小二乘法更关注数据拟合。
摘要由CSDN通过智能技术生成

 

一:背景:当给出我们一些样本点,我们可以用一条直接对其进行拟合,如y= a0+a1x1+a2x2,公式中y是样本的标签,{x1,x2,x3}是特征,当我们给定特征的大小,让你预测标签,此时我们就需要事先知道参数{a1,a2}。而最小二乘法和最大似然估计就是根据一些给定样本(包括标签值)去对参数进行估计<参数估计的方法>。一般用于线性回归中进行参数估计通过求导求极值得到参数进行拟合,当然也可以用牛顿法或者梯度上升。而逻辑回归——分类问题中寻找最佳参数,首先也是通过极大似然估计得到cost function,然后一般用梯度上升或者牛顿法求解参数。。。

此外多说一点:线性回归中的损失函数<cost function>和逻辑回归中的损失函数略有不同,linear regression中要不是最小二乘中的J(θ)<估计值与观察值的平方和最小>或者为最大似然估计中使联合概率密度达到最大。

而logistic regression中损失函数在这篇blog中讲解过:http://blog.csdn.net/lu597203933/article/details/38468303

 

二:最小二乘法:

基本思想:

简单地说,最小二乘的思想就是要使得观测点和估计点的距离的平方和达到最小.这里的“二乘”指的是用平方来度量观测点与估计点的远近(在古汉语中“平方”称为“二乘”),“最小”指的是参数的估计值要保证各个观测点与估计点的距离的平方和达到最小。

 

这里m

最小二乘法最大似然估计机器学习中常用的回归算最小二乘法的基本思想是选择参数使得模型能最好地拟合样本数据,也就是使得估计值和观测值之差的平方和最小化。这意味着最小二乘法将估计值与观测值的差异作为损失函数。 最大似然估计的基本思想是通过选择参数,使已知数据在某种意义下最有可能出现。这种意义通常指的是使数据的似然函数最大化。似然函数可以被理解为数据的概率分布函数,而最大似然估计的目标是找到使得数据的概率最大的参数。 在回归算中,最小二乘法最大似然估计都可以用于求解损失函数。不同之处在于最大似然估计需要已知数据的概率分布函数,而最小二乘法则不需要。一般假设数据满足正态分布函数的特性,此时最大似然估计最小二乘法得到的结果是相同的。 总结起来,最小二乘法以估计值与观测值的差的平方和作为损失函数,而最大似然估计最大化目标值的似然概率函数为目标函数。两种方在某些情况下可以得到相同的结果,但在某些情况下可能会有不同的表现。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [最小二乘法,最大似然估计什么情况下统一](https://blog.csdn.net/weixin_45834085/article/details/102958745)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值