"众包中的统计推断与激励机制" 主题报告速记与评述(三)

报告探讨了众包在大数据标注中的作用,强调了众包的统计推断方法和激励机制设计对提升数据集质量的重要性。通过解决标注者水平和动机不足的问题,利用极小极大熵原理优化标注不确定性,并提出满足“真实”和“没有免费午餐”准则的“Double-or-Nothing”奖励策略。
摘要由CSDN通过智能技术生成

笔者按 :机器学习正在走向基于“语义”的可解释模型的新时代。但在很多场合,例如“语义”驱动的监督学习器在能够达到更强泛化能力前,也还需要数据驱动型算法,而后者的“养料”是标注的大数据,周登勇博士的这个报告介绍了大数据标注的关键技术。
其它评述链接在此。

概要

报告分两个主要部分,并主要围绕第二部分展开讨论:
1. 为什么需要众包?
2. 提升众包质量的策略:提出了基于众包的标记质量和众包动机两个问题,并分别给出并介绍了统计推断机制和激励机制设计两个解决方案。

1. 为什么需要众包(Crowd-Sourcing)?

其实这个问题不如反过来问,比如为什么不用半监督学习呢?为什么不用杉山将的弱监督学习呢?为什么不用Dr. Fei-Sha 多任务学习(multi-task learning)、领域适应(domain adaptation)和零样本学习(zero-shot learning)解决小数据问题呢?

周博士的回答是:基于众包的标注可以做到既省时间又省钱,而且引用了ML领域的经典Remark:“更多的数

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值