机器学习算法系列（31）：在线最优化求解 FTRL等onine算法

最新推荐文章于 2023-07-15 19:21:28 发布

jumpba

最新推荐文章于 2023-07-15 19:21:28 发布

阅读量469

点赞数

文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaozhagn/article/details/106893377

版权

本文探讨在线学习的重要性，指出批量处理方法在处理大规模数据时的局限性，着重分析了在线最优化算法如SGD、TG、FOBOS和RDA在稀疏性方面的表现。L1-RDA因更aggressive的截断策略和避免训练不足问题，往往能获得更好的稀疏性。FTRL算法旨在结合L1-FOBOS的精度和L1-RDA的稀疏性优势。

摘要由CSDN通过智能技术生成

http://freewill.top/2017/07/26/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95%E7%B3%BB%E5%88%97%EF%BC%8831%EF%BC%89%EF%BC%9A%E5%9C%A8%E7%BA%BF%E6%9C%80%E4%BC%98%E5%8C%96%E6%B1%82%E8%A7%A3%EF%BC%88online%20Optimization%EF%BC%89/

文章重要内容摘要：

1. 为什么要有在线学习：无论是线性回归（Linear Regression）、逻辑回归（Logistic Regression）、支持向量机（SVM）、深度学习（Deep Learning）中，最优化求解都是基本的步骤。常见的梯度下降、牛顿法、拟牛顿法等属于批量处理的方法（Batch），每次更新都需要对已经训练过的样本重新训练一遍。当我们面对高维高数据量的时候，批量处理的方式就显得笨重和不够高效，因此需要在线处理的方法来解决相同的问题。而稀疏性对于高维特征向量以及大数据集又特别的重要。

2. 随机梯度下降可以作为一种在线学习（模型训练）的情况，但是稀疏性不行，原因：

先解释L1正则化为什么会产生稀疏解&

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法系列（31）：在线最优化求解 FTRL等onine算法

http://freewill.top/2017/07/26/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95%E7%B3%BB%E5%88%97%EF%BC%8831%EF%BC%89%EF%BC%9A%E5%9C%A8%E7%BA%BF%E6%9C%80%E4%BC%98%E5%8C%96%E6%B1%82%E8%A7%A3%EF%BC%88online%20Optimization%EF%BC%89/文章重要内容摘要：1. 为什么要有
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。