推荐系统笔记8-在线学习

年少_当自强

于 2019-02-07 10:50:46 发布

阅读量855

点赞数 1

分类专栏：推荐系统机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/buwei0239/article/details/86770628

版权

本文探讨了在线学习的重要性，特别是在数据分布变化和实时特征需求的背景下。它介绍了基于Bayes概率图模型、SGD及其变种、KNN以及Explore & Exploit策略的在线学习方法。同时，区分了在线学习、增量学习与离线学习的区别，强调了增量学习在处理新数据和保存历史知识方面的特点。最后提到了FTRL算法在在线学习中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文介绍在线学习的一些内容，并做一些总结，首先什么是在线学习，根据维基百科的定义，传送门，总结来说在线学习就是每来一个/批样本增量更新一次；
一、提一个问题，为什么需要在线学习，从下面几个角度探讨：

离线批量学习
- 早先的搜索学习能力，是基于批处理的离线机器学习。在每次迭代计算过程中，需要把全部的训练数据加载到内存中计算。虽然有分布式大规模的机器学习平台，在某种程度上批处理方法对训练样本的数量还是有限制的。在线学习不需要缓存所有数据，以流式的处理方式可以处理任意数量的样本，做到数据的实时消费。
特征实时
- 2014年双11，实时技术在大促场景上，实现了商品和用户的特征实时，表现不俗。
为什么需要模型在线学习呢？以及为什么实现秒级的模型更新？
- 数据分布变化：在批量学习中，⼀般会假设样本独立服从⼀个未知的分布，但如果分布变化，模型效果会明显降低。而在实际业务中，很多情况下，⼀个模型生效后，样本的分布会发生大幅变化，因此学到的模型并不能很好地匹配线上数据。实时模型，能通过不断地拟合最近的线上数据，解决这⼀问题，因此效果会较离线模型有较⼤提升。那么为什么实现秒级分钟级的模型更新？在双11这种成交爆发力强、

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。