task1 线性回归

最新推荐文章于 2022-04-21 13:56:00 发布

bearang

最新推荐文章于 2022-04-21 13:56:00 发布

阅读量394

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/bearang/article/details/103938690

版权

笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

最小二乘法（Least squares）
为什么叫最小二乘法，首先最小明确的告诉你，俺们求出来的是全局的最值，不是极值，就是最小的一个位置，二乘（square）是平方的意思，Ok，也就是说最小二乘法的理论是找到最小的平方值，什么的最小平方值？慢慢看下面。
参考书《机器学习基础教程》中的例子，以历届奥运会男子100米的夺冠时间为数据：

No. Year time
1 1896 12.0
2 1900 11.0
3 1904 11.0
4 1908 10.8
5 1912 10.8
6 1920 10.8
7 1924 10.6
8 1928 10.8
9 1932 10.3
10 1936 10.3
11 1948 10.3
12 1952 10.4
13 1956 10.5
14 1960 10.2
15 1964 10.0
16 1968 9.95
17 1972 10.14
18 1976 10.06
19 1980 10.25
20 1984 9.99
21 1988 9.92
22 1992 9.96
23 1996 9.84
24 2000 9.87
25 2004 9.85
26 2008 9.69
27 2012 9.63
注释：中间有三年数据缺失，原因是第一和第二次世界大战（闲的没事回家搞科研造福人类多好，打毛的仗）。
使用matlab显示下数据：

这里写图片描述
生成上图代码：

data=[1896 12.0;1900 11.0;1904 11.0;1908 10.8;1912 10.8;1920 10.8;1924 10.6;1928 10.8;1932 10.3;1936 10.3;1948 10.3;1952 10.4;1956 10.5;1960 10.2;1964 10.0;1968 9.95;1972 10.14;1976 10.06;1980 10.25;1984 9.99;1988 9.92;1992 9.96;1996 9.84;2000 9.87;2004 9.85;2008 9.69;2012 9.63];x=data(:,1);t=data(:,2);scatter(x,t,‘k’);
1
2
3
4
其中第三个参数可以由下表中查出：

这里写图片描述
很明显的下降趋势，不太明显的线性关系，不过我们还是用线性来拟合这组数据，看看会有什么效果。
设直线为：

t=w1x+w0

来解释下这个模型，我们的目的是让整条直线尽可能的和途中点数据相接近，而并不是要让一条直线穿过尽可能多的点，换句话说我们要追求一个全局的最优。
如何来衡量这个直线和各点之间的接近程度呢？这里给出一个平方损失函数，请注意，这并不是唯一的办法，不过是一种简单的方法，比如绝对值也能完成此类任务，但绝对值计算过于复杂，四次六次八次函数也能完成，很明显计算量也过大，所以我们的损失函数定义为：
ℓn=(tn−f(xn;w0,w1))2
其中：

f(xn;w0,w1)=w0+w1x
这样就给出了“二乘的部分”，求最小二乘的目的是得出全局最优解参数w1,w0

ℓ=1N∑Nn=1(tn−f(xn;w0,w1))2=1N∑Nn=1(tn−w0−w1x)2=1N∑Nn=1(w21x2n+2w1xn(w0−tn)+w20−2w0tn+t2n)
求最小值，一般的方法是求一阶导数，对于上式，我们认为自变量是w1,w0，xn,tn是参数（已知常数）,所以一阶导数要使用偏导数。
这样，求导前简化掉没用项：
当对w1求导数时：

1N∑Nn=1(w21x2n+2w1xnw0−2w1xntn)
整理求导后得到：

∂ℓ∂w1=2w11N(∑Nn=1x2n)+2N(∑Nn=1xn(w0−tn))
同理对w0求偏导：

∂ℓ∂w0=2w0+2w11N(∑Nn=1xn)−2N(∑Nn=1tn)
根据一阶导数为0时有可能为最值点（有可能是极值或者驻点，进一步判断需要求二阶偏导数得出，但对于平方形函数，一阶导数为零可以确定为最值）
这样就能求出：

w0^=t¯−w1x¯
w1^=xt¯−x¯t¯x2¯−(x¯2)
用一下代码对最上面图进行最小二乘拟合得到：

这里写图片描述
Matlab Code:

data=[189612.0;190011.0;190411.0;190810.8;191210.8;192010.8;192410.6;192810.8;193210.3;193610.3;194810.3;195210.4;195610.5;196010.2;196410.0;19689.95;197210.14;197610.06;198010.25;19849.99;19889.92;19929.96;19969.84;20009.87;20049.85;20089.69;20129.63];[m,n]=size(data);%m行，n列

x=data(:,1);t=data(:,2);scatter(x,t,'k');xt=0;x_=mean(x);t_=mean(t);x_2=0;for i=1:m    xt=xt+x(i)*t(i);    x_2=x_2+x(i)^2;endxt_mean=xt/m;x_2_mean=x_2/m;w1=(xt_mean-x_*t_)/((x_2_mean)-x_^2);w0=t_-w1*x_;x=data(:,1);t=data(:,2);scatter(x,t,'k');[m,n]=size(data);%m行，n列xt=0;x_=mean(x);t_=mean(t);x_2=0;for i=1:m    xt=xt+x(i)*t(i);    x_2=x_2+x(i)^2;endxt_mean=xt/m;x_2_mean=x_2/m;w1=(xt_mean-x_*t_)/((x_2_mean)-x_^2);w0=t_-w1*x_;%%使用矩阵解决%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%for i=1:m    X(i,1)=1;    X(i,2)=x(i);endw=(X'*X)^(-1)*X'*t;%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%refline(w1,w0);%w1斜率，w0截距refline(w1,w0);%w1斜率，w0截距

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
以上针对二维数据，对于超过二维的数据的线性回归我们使用矩阵来做等效处理。
对于超过二维的数据，损失函数定义如下：

ℓ=1N(t⃗ −Xw⃗ )T(t⃗ −Xw⃗ )
此处推导过程，与上二维数据推导过程类似，但使用矩阵为工具，故省略：

w⃗ ^=(XTX)−1XTt⃗
总结
至此，最小二乘法的基本过程已经介绍完了，基础算法可能数学推导过多，但对后面的高级算法理解还是很有用的。

# Created with Python AI

import numpy as np
np.random.seed(1234)
x=np.random.rand(500,3)
print(x)
y = x.dot(np.array([4.2,5.7,10.8]))
print(y)

import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt 
lr = LinearRegression(fit_intercept= True)
lr.fit(x,y)
print("估计的参数值为:%s" %(lr.coef_))
print('R2:%s' %(lr.score(x,y)))
x_test = np.array([2,4,5]).reshape(1, -1) 
y_hat = lr.predict(x_test) 
print("预测值为: %s" %(y_hat))
#最小二乘法
class LR_LS():
    def _init_(self):
        self.w = None
    def fit(self,X,y):
        temp0 = np.dot(X.T,X)
        temp = np.dot(np.linalg.inv(temp0), X.T)
        self.w = np.dot(temp, y)
        print(self.w)
        return self.w
    
    def predict(self,x):
        y_pred = np.dot(x,self.w)
        print(y_pred)
        return y_pred
       
if __name__ == "__main__":
    lr_ls = LR_LS()
    lr_ls.fit(x,y)
    print("估计的参数值：%s" %(lr_ls.w))
    x_test = np.array([2,4,5]).reshape(1,-1)
    print("预测值为: %s" %(lr_ls.predict(x_test)))

bearang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
task1 线性回归

最小二乘法（Least squares）为什么叫最小二乘法，首先最小明确的告诉你，俺们求出来的是全局的最值，不是极值，就是最小的一个位置，二乘（square）是平方的意思，Ok，也就是说最小二乘法的理论是找到最小的平方值，什么的最小平方值？慢慢看下面。参考书《机器学习基础教程》中的例子，以历届奥运会男子100米的夺冠时间为数据：No. Year time1 1896 12.02 1900...
复制链接

扫一扫

专栏目录