Web science 笔记 Crowdsourcing, Stock prediction

Crowdsourcing

Outsourcing some tasks to a crowd -> Crowdsourcing
Improve the quality, timeliness and breadth of data
将一些任务外包给人群 -> Crowdsourcing
提高数据的质量、及时性和广度

Key questions:

  • What computational problems can/should be solved?
    Data augmenting, Data processing

  • What are the programming paradigms/platforms?
    A programming paradigm is the classification, style or way of programming. It is an approach to solve problems by using programming languages.

  • How do we guarantee that the solution is accurate, efficient and economical?
    Quality, cost and latency

  • How do we motivate participation and leverages their unique expertise and interests of workers?

  • How do we leverage the joint efforts of both automated and
    human computers as workers?

3 central aspects of crowdsourcing

  • What
    • What tasks can be performed by machines
    • Decompose the macro and micro tasks
  • Who
    • Expertise of workers (如何模拟工人的专业知识)
    • Manage cultural aspects and language barrier
  • How
    • How to design and execute tasks
    • Aggregate noisy & complex output ( defines how intelligent aggregation techniques should be, such as Hierarchical—cluster-based aggregation) 聚合嘈杂和复杂的输出(定义智能聚合技术应该如何,例如分层 - 基于集群的聚合)

Overall process

Process

  • 使用Parallel安排worker
    • Operations & Control: 多产线并行,成本高
    • Cost vs latency:cost high, low latency 成本高,延迟小
  • 使用sequential安排worker
    • Operations & Control: 一个接一个
    • Cost vs latency:延迟高,需要等上一个工人的结果,但如果计划分配三名工人,如果他们中的两个同意结果,那么不需要执行另一个 HIT,节约成本
  • Operations & Control
    • Repetition
      You repeat the tasks until you are satisfied
      重复任务直到满意
    • Selection
      You retrieve tasks using selection mechanisms
      使用选择机制检索任务

Aggregating output

Challenges

  • Outputs are noisy (lack of expertise)
  • Humans are not always reliable (cheating)
  • Cultural context may bias the answers

Goal

  • Automatic procedure to merge HIT results

Assumptions

  • There exists a “true” answer
  • Redundancy helps

挑战

  • 输出嘈杂(缺乏专业知识)
  • 人类并不总是可靠的(作弊)
  • 文化背景可能会影响答案

目标

  • 自动合并 HIT 结果的程序

假设

  • 存在一个“真实”的答案
  • 冗余有帮助

Latent Class models
在这里插入图片描述
crowdsourcing

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值