【Machine Learning实验1】batch gradient descent（批量梯度下降）和 stochastic gradient descent（随机梯度下降）

最新推荐文章于 2024-07-31 14:47:45 发布

pennyliang

最新推荐文章于 2024-07-31 14:47:45 发布

阅读量2.4w

点赞数 3

分类专栏：写给自己的博客文章标签： matrix float algorithm 测试 c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pennyliang/article/details/6998517

版权

本文介绍了批量梯度下降和随机梯度下降两种机器学习中的优化算法。批量梯度下降适合小规模数据，而随机梯度下降适用于大规模数据但可能陷入局部最优解。讨论了可能的改进点，包括样本验证、算法改进、训练路径选择、假设检验以及维度放大带来的过拟合问题。通过一个衣服估价的实验，展示了如何使用这两种方法求解未知权重。

摘要由CSDN通过智能技术生成

批量梯度下降是一种对参数的update进行累积，然后批量更新的一种方式。用于在已知整个训练集时的一种训练方式，但对于大规模数据并不合适。

随机梯度下降是一种对参数随着样本训练，一个一个的及时update的方式。常用于大规模训练集，当往往容易收敛到局部最优解。

详细参见：Andrew Ng 的Machine Learning的课件（见参考1）

可能存在的改进

1）样本可靠度，特征完备性的验证

例如可能存在一些outlier，这种outlier可能是测量误差，也有可能是未考虑样本特征，例如有一件衣服色彩评分1分，料子1分，确可以卖到10000万元，原来是上面有一个姚明的签名，这个特征没有考虑，所以出现了训练的误差，识别样本中outlier产生的原因。

2）批量梯度下降方法的改进

并行执行批量梯度下降

3）随机梯度下降方法的改进

找到一个合适的训练路径（学习顺序），去最大可能的找到全局最优解

4）假设合理性的检验

H（X)是否合理的检验

5）维度放大

维度放大和过拟合问题，维度过大对训练集拟合会改善，对测试集的适用性会变差，如果找到合理的方法？

下面是我做的一个实验

假定有这样一个对衣服估价的训练样本，代码中matrix表示，第一列表示色彩的评分，

最低0.47元/天解锁文章

关注

3
点赞
踩
27

收藏

觉得还不错? 一键收藏
14
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 14

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。