对话系统论文集(**)-online learning介绍

定义:及时更新参数,对话->用户反馈->参数更新
系统显示:

模型目标:

实现方式:
一般两种:贝叶斯;Follow The Regularized Leader
1)贝叶斯:

当后验和先验是用一种分布时,只是参数有所调整。当先后的分布不同类型时,使用先验分布类型(参数设置成和后验分布结果差不多)代替。
贝叶斯在用的时候常常是以更高级的BPR(Bayesian Probit Regression)出现。
2)Follow The Regularized Leader
思想就是每次找到让之前所有损失函数之和最小的参数。在损失函数的后面加一个正则项,防止过拟合。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值