模型实时性与训练方式-CSDN博客

本文链接：https://blog.csdn.net/u011311291/article/details/122697680

模型的实时性与模型的训练方式紧密相关，模型的实时性由弱到强的训练方式分别是全量更新，增量更新和在线学习。
1.全量更新
模型在某个时间段内所有训练样本进行训练，全量更新是最常用的训练方式
2.增量更新
增量更新仅将新加入的样本“喂”给模型进行增量训练，从技术上讲，深度学习模型往往采用随机梯度下降SGD法及其变种进行学习，缺点是增量更新的模型往往无法找到全局最优点，因此在实际的推荐系统中，经常采用增量更新与全局更新结合的方式，在进行了几轮增量更新后，在业务量较小的时间窗口进行全局更新。
3.在线学习
是进行模型实时更新的主要方法，也就是在获得一个新的样本的同时更新模型，与增量更新一样，在技术上也是使用SGD训练方式实现，但由于需要在线上环境进行模型的训练和大量模型相关参数的更新和存储，工程上的要求比较高。在线学习另一个附带问题是模型的稀疏性不强，例如一个输入特征量达到几百W维的模型中，如果模型的稀疏性好，就可以在模型效果不受影响的前提下，仅让极小一部分的特征权重非0，从而让上线的模型体积很小(摒弃掉所有权重为0的特征)，在这方面，兼顾训练效果和模型稀疏性，有大量相关研究，包括微软的FOBOS，谷歌的FTRL等。
在线学习的另一个方向是将强化学习与推荐系统结合，在DRN模型中，应用竞争梯度下降算法等。
4.局部更新
进行模型的局部更新，降低训练效率低的部分的更新频率，提高训练效率高的部分的更新频率，例如Facebook的GBDT+LR模型，GBDT训练效率低，更新周期长，这样Facebook采取每天训练一次GBDT，固定GBDT模型后，实时训练LR模型。模型局部更新的做法较多应用在“Embedding+神经网络”模型中，业界往往采用Embedding层单独预训练和EMbedding层以上的模型部分高频更新的混合策略。
5.客户端模型实时更新
能否在客户端就根据当前用户的行为历史更新模型呢？在推荐系统业界仍处于探索阶段，对于一些计算机视觉的模型，可以通过模型压缩的方式生成轻量级模型，部署于客户端，但对于推荐模型这类重量级模型，需要依赖服务端强大计算资源和丰富的特征数据进行模型服务。但客户端往往可以保存和更新模型一部分的参数和特征，比如当前用户的Embedding向量。这里的逻辑和动机是，模型往往要接受用户Embedding和物品Embedding两个关键的特征向量。对于物品Embedding的更新，一般需要全局的数据，因此只能在服务端进行更新，而对于用户Embedding,更多依赖用户自身的数据，这部分放在客户端，能实时把用户最近的行为数据反应的用的Embedding。例如用户Embedding是由用户点击过的物品Embedding进行平均得到，那么最先得到用户最新点击物品信息的客户端，就可以根据用户点击物品的Embedding实时更新用户Embedding，并保存在该Embedding,在下次推荐时，将更新后的用户Embedding传给服务器，服务器端可根据最新的用户Embedding返回实时推荐内容。

参考《深度学习推荐系统》