【第1.2周:线性回归】

zcj_gugugu

已于 2024-04-17 17:55:17 修改

阅读量461

点赞数 12

分类专栏：机器学习期末复习文章标签：线性回归算法回归 matlab

于 2023-11-27 21:32:04 首次发布

本文链接：https://blog.csdn.net/zcj_gugugu/article/details/134655043

版权

7 篇文章 0 订阅

订阅专栏

人工智能>机器学习>表示学习>深度学习
在这里插入图片描述
表示学习：可以自动地学习出样本的有效特征, 从而提升模型性能的方法。
深度学习：本质上是表示学习，都是自动学习出样本的有效特征。但深度学习把输入数据的特征经过多次非线性转化，所谓深度就是非线性转化的次数。

从数据中产生模型h

在这里插入图片描述

梯度下降算法的每次迭代受到学习率的影响，如果学习率𝑎过小，则达到收敛所需的迭代次数会非常高；
如果学习率𝑎过大，每次迭代可能不会减小代价函数，可能会越过局部最小值导致无法收敛。
通常可以考虑尝试些学习率：
𝛼 = 0.01，0.03，0.1，0.3，1，3，10

多变量样本
其中，在这里插入图片描述

目的是帮助梯度下降算法更快地收敛。x0≡1
特征缩放公式

在这里插入图片描述

梯度下降与正规方程的比较：
在这里插入图片描述
总结：只要特征变量的数目并不大，标准方程是一个很好的计算参数𝜃的替代方法。具体地说，只要特征变量数量小于一万，我通常使用标准方程法，而不使用梯度下降法。

代价函数

h=X*theta;
J=sum((h-y).^2)/(2*m);

梯度下降

derivative=(X'*(X*theta-y))/(m); 
theta=theta-alpha*derivative;

特征缩放

mu=mean(X(:,1:2));%%1xn平均值nnn
s=std(X(:,1:2));%%1xn标准差
MU=ones(size(X,1))*mu;%%得到mxn的全是平均值的矩阵
S=ones(size(X,1))*S;%%得到mxn的全是标准差的矩阵
X_norm=(X-MU)./S;

代价函数

h=X*theta;
J=sum((h-y).^2)/(2*m);

梯度下降

derivative=(X'*(X*theta-y))/(m); 
theta=theta-alpha*derivative;

正规方程

theta=pinv(X'*X)*X'*y;%%pinv求逆函数

关注

专栏目录