02:机器学习实战：最小二乘法

恩喜玛生物

于 2024-04-29 22:00:38 发布

阅读量196

点赞数 12

文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84540063/article/details/138326671

版权

最小二乘法推导

多元线性回归的写法

与数学中不同的是，在机器学习中，系数w和截距b是需要求得的未知数，而特征x和标签y则是已知的。

将上边的方程写成矩阵形式便是

此时的，w和x都是矩阵，，

普通线性回归中的目标便是求的w和b两个参数，w其实是weight的简写，意为自变量的权重。

普通线性回归常用的损失函数（L）是SSE（误差平方和），即（真实值-预测值）的平方之和

其中称为2范数，不过在这里暂时用不到。可以看到，损失函数是关于参数w的函数。目标是对损失函数求最小值，因此可以让其偏导数=0

如果只有一个特征那么可以在二维图中展示：

可以看到，模型使用一条直线拟合散点，损失函数就是真实值到预测值的欧式距离的和，求损失函数最小值即是使直线尽可能拟合到更多的点。

对w求偏导

阶梯型矩阵：所给矩阵为行阶梯型矩阵，则矩阵中每一行的第一个不为零的元素的左边及其所在列以下全为零。

矩阵的秩（rank）：把矩阵经过初等行变换成阶梯型矩阵，非0行的个数即为其秩。

满秩：矩阵的秩=其行数，或者说阶梯型矩阵没有非0行，或者说其行列式≠0

求A的逆矩阵

因此，比如我们的两个基因表达量相关性过高，就会造成多重共线性，建模中解决多重共线性的方法是可以对损失函数加上惩罚项，比如拉索回归、岭回归和弹性网络。

参考：https://baike.baidu.com/item/%E5%A4%9A%E9%87%8D%E5%85%B1%E7%BA%BF%E6%80%A7/10201978?fr=aladdin

https://www.bilibili.com/video/BV1UU4y1M73o?vd_source=d18945ce98e39afc8362968bf50c8dde

https://www.bilibili.com/video/BV1vJ41187hk?p=59&vd_source=d18945ce98e39afc8362968bf50c8dde https://zhuanlan.zhihu.com/p/355241680

https://zhuanlan.zhihu.com/p/486971703

300?wx_fmt=png&wxfrom=18

生信探索

分享收藏23

发消息

人划线

恩喜玛生物

关注

12
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
02:机器学习实战：最小二乘法

因此，比如我们的两个基因表达量相关性过高，就会造成多重共线性，建模中解决多重共线性的方法是可以对损失函数加上惩罚项，比如拉索回归、岭回归和弹性网络。可以看到，模型使用一条直线拟合散点，损失函数就是真实值到预测值的欧式距离的和，求损失函数最小值即是使直线尽可能拟合到更多的点。普通线性回归中的目标便是求的w和b两个参数，w其实是weight的简写，意为自变量的权重。：所给矩阵为行阶梯型矩阵，则矩阵中每一行的第一个不为零的元素的左边及其所在列以下全为零。是需要求得的未知数，而特征。此时的，w和x都是矩阵，，
复制链接

扫一扫

恩喜玛生物 CSDN认证博客专家 CSDN认证企业博客

码龄97天

36: 原创

110万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

824: 积分

347: 粉丝

462: 获赞

5: 评论

339: 收藏

私信

关注

热门文章

最新评论

部署ShinyApp
2401_82930447: 你好，看到私信请回复一下，谢谢，不知道有条数限制，我还没说完
Hello World感知机，懂你我心才安息
恩喜玛生物: 图片转存失败，需要私我
使用Arrow管理数据
ha_lydms: 这个博客是我心灵的驿站，每次阅读都能够让我感到内心平静和宁静。
02:机器学习实战：最小二乘法
恩喜玛生物: 需要的丝我有些符号打不出来
02:机器学习实战：最小二乘法
恩喜玛生物: 多元线性回归的写法 y=w1x1 +W2X2+...+Waxd+b 与数学中不同的是，在机器学习中，系数W和截距 b 是需要求得的未知数，而特征x和标签y 则是已知的。将上边的方程写成矩阵形式便是 y=wx+b 此时的，w和x都是矩阵， w=[w1,w2,...wd]T, x =[x1,x2,...xd]¹ 普通线性回归中的目标便是求的w和b两个参数，w其实是weight的简写，意为自变量的权重。 ·普通线性回归常用的损失函数(L)是SSE (误差平方和)，即(真实值-预测值)的平方之和 L(w) =∑ m m`(yi -9i)²=∑(yi - Xiw)²= i=1 其中||y - Xû||称为2范数，不过在这里暂时用不到。可以看到，损失函数是关于参数 w的函数。目标是对损失函数求最小值，因此可以让其偏导数=0

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。