推荐系统笔记8-在线学习

本文探讨了在线学习的重要性,特别是在数据分布变化和实时特征需求的背景下。它介绍了基于Bayes概率图模型、SGD及其变种、KNN以及Explore & Exploit策略的在线学习方法。同时,区分了在线学习、增量学习与离线学习的区别,强调了增量学习在处理新数据和保存历史知识方面的特点。最后提到了FTRL算法在在线学习中的应用。
摘要由CSDN通过智能技术生成

本文介绍在线学习的一些内容,并做一些总结,首先什么是在线学习,根据维基百科的定义,传送门,总结来说在线学习就是每来一个/批样本增量更新一次;
一、 提一个问题,为什么需要在线学习,从下面几个角度探讨:

  • 离线批量学习
    • 早先的搜索学习能力,是基于批处理的离线机器学习。在每次迭代计算过程中,需要把全部的训练数据加载到内存中计算。虽然有分布式大规模的机器学习平台,在某种程度上批处理方法对训练样本的数量还是有限制的。在线学习不需要缓存所有数据,以流式的处理方式可以处理任意数量的样本,做到数据的实时消费。
  • 特征实时
    • 2014年双11,实时技术在大促场景上,实现了商品和用户的特征实时,表现不俗。
  • 为什么需要模型在线学习呢?以及为什么实现秒级的模型更新?
    • 数据分布变化:在批量学习中,⼀般会假设样本独立服从⼀个未知的分布,但如果分布变化,模型效果会明显降低。而在实际业务中,很多情况下,⼀个模型生效后,样本的分布会发生大幅变化,因此学到的模型并不能很好地匹配线上数据。实时模型,能通过不断地拟合最近的线上数据,解决这⼀问题,因此效果会较离线模型有较⼤提升。那么为什么实现秒级分钟级的模型更新?在双11这种成交爆发力强、
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值