定义:及时更新参数,对话->用户反馈->参数更新
系统显示:
模型目标:
实现方式:
一般两种:贝叶斯;Follow The Regularized Leader
1)贝叶斯:
当后验和先验是用一种分布时,只是参数有所调整。当先后的分布不同类型时,使用先验分布类型(参数设置成和后验分布结果差不多)代替。
贝叶斯在用的时候常常是以更高级的BPR(Bayesian Probit Regression)出现。
2)Follow The Regularized Leader
思想就是每次找到让之前所有损失函数之和最小的参数。在损失函数的后面加一个正则项,防止过拟合。
对话系统论文集(**)-online learning介绍
最新推荐文章于 2024-07-18 16:15:38 发布