机器学习-正规方程

最新推荐文章于 2024-02-21 14:56:56 发布

photographyCat

最新推荐文章于 2024-02-21 14:56:56 发布

阅读量931

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lx529068450/article/details/102840689

版权

机器学习专栏收录该内容

8 篇文章 4 订阅

订阅专栏

吴恩达机器学习笔记系列

一、什么是正规方程

梯度下降法计算参数最优解，过程是对代价函数的每个参数求偏导，通过迭代算法一步步更新，直到收敛到全局最小值，从而得到最优参数。

正规方程是一次性求得最优解。

思想：对于一个简单函数，对参数求导，将其值置为0，就得到参数的值。像下面这样：
在这里插入图片描述

现实例子有很多参数，我们要对这些参数都求偏导数，得到各个参数的最优解，也就是全局最优解。但是困难在于，这样做非常浪费时间。

二、正规方程的使用

举例如下：

在这里插入图片描述

这里4个样本，以及4个特征变量x1,x2,x3,x4，观测结果是y，在列代价函数的时候，需要加上一个末尾参数x0，如下：
在这里插入图片描述

再将特征参数保存在X矩阵中，对观测结果做同样的操作并保存在向量y中，如图：
在这里插入图片描述

然后我们通过下面这个公式得出参数θ最优解。

在这里插入图片描述

关于这个式子推到：
在这里插入图片描述

对于一个训练样本的所有特征参数可以用x(i)向量来表示（注意x0(i)要加上），而设计矩阵就可以表示为X，是所有样本向量的转置，y是观测结果的向量，这样表示之后可以用上面那个公式直接计算Θ的最优解。

三、不可逆情况

注意到正规方程有一个在这里插入图片描述求逆矩阵的过程，当矩阵不可逆，一般有两种原因：

多余特征（线性相关）
太多特征（例如：m≤n），解决办法：删除一些特征，或正则化
其实，本质原因还是线性知识：

首先，这是两个必要条件，

根据性质：r(ATA) = r(A)，ATA可逆性可转化为A的可逆性。

第一种：实际上是线性相关的列向量，矩阵的秩 < 矩阵的维度，不可逆；

第二种：

m < n时，也就是维度小于向量个数，在这里也就是样本数小于特征数，线性相关
m = n时，当|A| = 0时不可逆，|A| != 0时可逆

四、正规方程与梯度下降法的比较

梯度下降法：

缺点：

需要选择学习率α
需要多次迭代
优点：

当特征参数大的时候，梯度下降也能很好工作

正规方程：

缺点：

需要计算，在这里插入图片描述计算量大约是矩阵维度的三次方，复杂度高。
特征参数大的时候，计算缓慢
优点：

不需要学习率α
不需要多次迭代

总结：取决于特征向量的个数，数量小于10000时，选择正规方程；大于10000，考虑梯度下降或其他算法。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

photographyCat CSDN认证博客专家 CSDN认证企业博客

码龄12年

42: 原创

8万+: 周排名

142万+: 总排名

6万+: 访问

: 等级

1007: 积分

17: 粉丝

34: 获赞

7: 评论

241: 收藏

私信

关注

热门文章

分类专栏

机器学习 8篇
爬虫 1篇
SQL 1篇
Hadoop 10篇
Linux 7篇
Python 16篇
Java 6篇
SpringBoot 1篇
Vue 1篇

最新评论

机器学习基础 - 偏度、正态化以及 Box-Cox 变换
fdghshgsfhdtbxgh: 请问下正态分布化处理后还需要进行归一化处理吗
Hive表导出成csv文件
你海哥啊: 这是把数据导出到hdfs了吗？
Python多进程中的文件写入问题
爱学习的杨子: 前别你好，我想请问一下，有没有一种方法能够使用多进程按照顺序分别读取一个文件夹内的所有内容
fbprophet安装步骤（centOS）
_yxy_: 安装成功了，谢谢！
Zookeeper笔记
STouny: 你好，请问您发布的excel导入百度地图里，excel的要求格式是怎么样的啊，一共四列，每列要填什么啊？还有经纬度的格式是度分秒的标准格式还是度分秒简化，或者是小数度格式啊，可否麻烦您告知一下，谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。