线性回归之梯度下降学习法

最新推荐文章于 2022-12-22 14:39:19 发布

Good LA

最新推荐文章于 2022-12-22 14:39:19 发布

阅读量426

点赞数

分类专栏：人工智能文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36180997/article/details/117433961

版权

人工智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

MSE公式

由上一篇数值预测得到的MSE公式为：
在这里插入图片描述

对于wx+b-y，其中wx+b为预测直线，y为样本数据的y值，用yi表示。由于yi对于wx+b预测直线，x值是相同的，因此可以将x=xi，xi、yi为样本数据的值。而b值是一个常量。这时候可以看成求w的值，使得MES最小。(此时x、b、y都是固定值，w是变量)

MSE对于W的曲线如下图所示：
在这里插入图片描述

对MSE公式求导：
在这里插入图片描述
设求导公式A = mse/w
若A > 0, 则w需要变小，w - A 可以使得w变小
若A < 0，则w需要变大，w - A可以使得w变大
若A = 0，w取得最合适的值，此时MSE最小

因此我们可以给w一个值，取得 A的大小，然后w - A求的一个新的w值，即 w(i+1) = w(i) - A。这个不停找最合适的W的过程，称之为梯度下降学习法。

最终得到求w的公式：w(i+1) = w(i) - αA，其中α为学习因子，影响w的变化率，一般的，α根据经验和计算可以得到。

那么训练集应该取多少合适呢？
当训练集越小的时候，训练出来的结果在测试集得到的误差也越大。
当训练集越大的时候，往往需要巨大的算力，很难得到训练结果。
因此训练集不应该太大，也不应该太小。

思考：
MSE越小越好吗？
不是的！MSE太小，可能会有过拟合的问题。即训练集取得太少或者不合理，使得在测试集表现反而变差。这样训练出来的数据不具备普遍性。

在训练集上，MSE随着t训练时间增加而变小，测试集使用训练集的结果，随着时间t增加时，开始时呈下降趋势，直到临界点t1时，测试集反而会随着训练时间t变大。因此t1为合理的训练时间。

思考：
假设有n个数据取m个数据做训练，在实际中，如果m取值小，和实际mse偏差大。如果 m取值太大，和实际mse就偏差小。这时候需要考虑运算量和振幅。振幅d可以表示为d = 1/√m，当m越大，震荡幅度越小。当m增加100倍时，运算量增加100倍，震荡幅度为1/10。当运算量增大10000倍，运算量增加10000倍，偏差d震荡幅度为1/100。因此，增大运算量带来的性价比不高。在实际中会取m=2^n，m取值128、256这种小值，多算几次，性价比会更高。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归之梯度下降学习法

MSE公式由上一篇数值预测得到的MSE公式为：对于wx+b-y，其中wx+b为预测直线，y为样本数据的y值，用yi表示。由于yi对于wx+b预测直线，x值是相同的，因此可以将x=xi，xi、yi为样本数据的值。而b值是一个常量。这时候可以看成求w的值，使得MES最小。(此时x、b、y都是固定值，w是变量)MSE对于W的曲线如下图所示：对MSE公式求导：设求导公式A = mse/w若A > 0, 则w需要变小，w - A 可以使得w变小若A < 0，则w需要变大，w - A可以
复制链接

扫一扫

专栏目录

Good LA CSDN认证博客专家 CSDN认证企业博客

码龄8年

103: 原创

30万+: 周排名

141万+: 总排名

9万+: 访问

: 等级

1114: 积分

327: 粉丝

24: 获赞

16: 评论

56: 收藏

私信

关注

分类专栏

ES在生产环境中的应用实践
工作总结 16篇
ElasticSearch 3篇
产品运营
redis 10篇
数据库 8篇
队列 1篇
线程池 5篇
网络 8篇
算法 2篇
dubbo 1篇
zk 2篇
分布式 1篇
设计模式 11篇
多线程 1篇
Spring 2篇
rocketmq 3篇
jdk 2篇
人工智能 2篇
程序员的数学 1篇
web_private
netty 1篇
NIO 4篇

最新评论

NIO演进(三)
彭小胀: os是怎么追踪的
NIO之多Selector多线程模式(四)
TOMQI666: 有点东西，这个示例演示的selector.wakeup的用法真的很不错。从另一篇在程序内自己控制阻塞流程的文章过来的，相比之下，那种方式要考虑什么时候阻塞什么时候放行，博主的这个方法就很赞了，很有收获也贴一下之前看的文章，那篇文章代在客户端多次连接的情况下会有问题，原因是他只在首次连接的时候保证register和select的执行顺序，后面要一直保证这个顺序就容易影响执行效率https://blog.csdn.net/qq_43147121/article/details/106611346
MYSQL之SQL优化一
tao_33: 按照
MYSQL之SQL优化一
大家一起学编程（python）: 活到老，学到老
MYSQL之SQL优化一
欧阳呀: CSDN不能失去这种优质文章，就像西方不能失去耶路撒冷，大佬有时间互访一波

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。