python 最小二乘法_最小二乘法与最小一乘法

3e4cf60332383bc4669e768fc5a79a8f.png

什么是最小二乘法:

最小二乘法是一种误差度量方法,一种被优化的问题,在线性最小二乘问题中可以直接求解

得到全局最优,但是在非线性最小二乘问题中无法用此方法求解,此时就需要迭代法来求解,比如梯度下降法,牛顿法。

最小二乘与极大似然的关系:
在测量误差服从高斯分布的情况下,最小二乘法等价于极大似然估计。

举例:
假设样本是从高斯分布中采样获得,高斯概率分布函数为:

噪声服从高斯分布的意思就是说,样本取值的期望 u 落在我们将要拟合的直线上。但是由于高斯噪声的存在,会一个偏差,该偏差符合正态分布,在两个标准差之间的范围内,两个标准差内的概率约为96%。这里的每一个样本都独立同分布,于是他们的联合概率应该满足:

累乘的结果是:

省略后面的乘项。上式相乘简化为指数相加,指数部分变为:

只看分子,得:

这便是最小二乘的模样。最小二乘法的思想是要求平方和尽可能小。上式前面加上了负号,也就是上式尽可能大,式是一个指数,指数越大,便是联合概率越大,联合概率越大,表示样本的落点越有可能贴近拟合的直线,这便是最大似然的思想。

最小一乘法介绍:
最小一乘法只要求各实测点到回归直线的纵向距离的绝对值之和为最小。它不要求随机误差服从正态分布,“稳健性”比最小二乘法好。在数据随机误差不服从正态分布时,最小一乘法的统计性能优于最小二乘法。【百度百科】

举例:
当噪声服从拉普拉斯分布时的概率分布为:

,此时指数部分为绝对值,表示的是,所有数据到拟合出的直线的距离之和最小。新样本有最大可能的靠近该拟合的直线。

结论:

对于噪声的分布不同,应该选取对应的拟合方式。如果数据符合高斯分布,此时做线性回归应该用最小二乘法。

题图代码:

## 公众号:深度学习视觉
## Author:Fain
## Blog:Fainke.com

import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
%matplotlib inline
sns.set(style="darkgrid") 

fig = plt.figure(figsize=(10,6))

plt.xlim([-10, 10]);
plt.ylim([-0.05, 1.6]);

# 定义数值
U = 0
x = np.sort(np.linspace(-10,10,1000))

# 最小二乘法
PI = np.pi
ST = 2
fx1 = (1/ST*np.sqrt(2*PI))*np.exp(-((x-U)**2)/(2*ST**2))

# 最小二乘法
B = 2
fx2 = (1/2*B)*np.exp(-abs(x-U)/B)

# 绘图
plt.plot(x,fx1,color="#ff0000", label = r"$ f(x ; mu, sigma)=frac{1}{sigma sqrt{2 pi}} exp left(-frac{(x-mu)^{2}}{2 sigma^{2}}right) $")
plt.plot(x,fx2,color="#0000ff", label = r"$ f(x | mu, b)=frac{1}{2 b} exp left(-frac{|x-mu|}{b}right) $")

plt.legend(prop={'family' : 'Times New Roman', 'size'   : 12})
plt.show()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值