悬赏17万:美国“知乎”的沙雕问题,需要AI来识别

智栗 发自 凹非寺
量子位 出品 | 公众号 QbitAI

知乎上面,时常会出现一些“睿智”的问题。

比如,一颗陨石如何挑选自己的归宿:

640?wx_fmt=png

又比如,公交车的职业操守如何:

640?wx_fmt=png

这么可爱的问题,并非知乎独享。

知乎的大前辈Quora上面,也有一些脑回路别具一格的人类:

640?wx_fmt=png

我的MacBook Air重量是2.3磅。

下载的东西多了之后,它会不会越来越重?

下载的小电影多了之后,它会不会爆炸?

既然,大家都喜欢这样可爱的问题,怎么才从千千万万个问题里面,把它们找出来呢?

重赏之下,必有勇夫。

Quora拿出25,000美元作为奖金,举办了一场Kaggle比赛:

有毒问题在哪里?    

640?wx_fmt=png

比赛内容之一,就是让AI识别出建立在虚假前提上的问题,简称虚假问题 (Insincere Questions) 。

所以,怎样算是虚假前提

还是举起开头的栗子,“陨石坠地前,那陨石坑已经存在”,这是个合格的虚假前提了。

第二,AI要识别的对象还包括,打着提问的旗号,实则在表达观点,这样的问题。

例如,对某一人群表现出歧视、攻击或者侮辱的问题:

640?wx_fmt=jpeg

第三,若是为给别人带来冲击力 (不为寻求答案) 而使用了性内容,也会成为缉拿对象。净化网络环境,也是保护祖国的花朵。

640?wx_fmt=png

 来自山下智博

以上概括起来,任务就是揪出那些并非真心发问而另有用意的问题。

Quora说,站内已经在用机器学习与人类一同完成这项任务了,不过依然需要大家的帮忙。所以才为选手们提供了不错的回报:

冠军,12,000美元

亚军,8,000美元

季军,5,000美元

640?wx_fmt=png

 如何在一夜之间学会编程?(急,在线等)

比赛用的数据,就是Quora里面的问题。官方提供的数据集,分为训练集合测试集。训练集里有超过130万个问题,测试集里有5.6万个问题。信息包括:问题ID,问题本身,以及问题是否虚假。

在此之外,选手不可以使用其他数据来训练模型。

比赛成绩,是由模型的F1分数决定的:

这里,问题只有两种分类,一是虚假,二是正常。F1分就是衡量二分类模型准确度的指标,兼顾了精确率 (Precision) 和召回率 (Recall) 。

640?wx_fmt=png

这场为期3个月的比赛,一周前已经启动。现在,已经有超过750支队伍参与其中,排行榜也一直在变化。

窃以为,解锁不可描述的问题,应该是一项愉悦身心的活动。

那么,想要参加比赛的同学注意一下:

报名截止日期为2019年1月29日。

提交截止日期为2019年2月5日。

参赛地址在这里:
https://www.kaggle.com/c/quora-insincere-questions-classification

有问,必有答

最后的最后,母交车到底能不能吸引公交车?

640?wx_fmt=png

有理有据,令人信服。

年度评选申请

640?wx_fmt=jpeg

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

活动策划招聘

量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值