Adaptive Selective Sampling for Online Prediction with Experts

该文探讨在线二元序列预测问题,采用标签高效的选择性采样算法,减少反馈成本并保持预测准确性。在对抗性环境下,针对最佳专家场景,通过指数加权平均方法改进预测策略,并以遗憾作为性能评价指标。
摘要由CSDN通过智能技术生成

我们使用以下标准,为在线预测和主动学习研究提供一个结构化的分类和区分方法,正如论文及其参考文献中所讨论的那样。以下是每个标准的详细解释:

  1. 预测任务: 这是指研究旨在解决的基本问题。

    • 二元分类: 最简单的形式,目标是预测两种可能的结果之一(例如,明天会下雨吗?是或否)。
    • 多类别分类: 更一般的问题,其中有两种以上可能的结果(例如,将电子邮件分类为垃圾邮件、促销邮件或重要邮件)。
    • 回归: 预测一个连续值而不是离散标签(例如,预测明天的温度)。
  2. 反馈机制: 这描述了学习算法如何接收有关其预测正确性的信息。

    • 完整信息: 算法在每次预测后都会收到真实标签(正确答案),从而可以直接进行比较和学习。
    • 标签高效/选择性采样: 获取标签的成本可能很高。算法会策略性地选择何时请求真实标签,平衡对反馈的需求与获取反馈的成本。
    • 老虎机反馈: 算法只接收一个
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

结构化文摘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值