开源社按
近年来开源技术蓬勃发展,开源创新与协同有力地推动了产业的发展进程;而人工智能尤其是深度学习相关的开源蓬勃发展,对人工智能相关产业正发挥着积极的影响。“智联世界,无限可能”,开源社作为WAIC 2019 黑客马拉松社区合作伙伴,诚邀您报名感兴趣的赛题。
2019 年世界人工智能大会(WAIC)是经国务院批准,国家发展改革委、科技部、工业和信息化部、国家互联网信息办公室、中国科学院、中国工程院等部委与上海市政府共同举办的顶级人工智能会议。今年的 WAIC 以「智联世界 无限可能」为主题,将于 8 月 29 日至 31 日在上海举办。
世界人工智能大会黑客马拉松作为 WAIC 期间唯一的一场黑客松,由机器之心承办,此次黑客松设计多道赛题,聚焦 AI 技术与应用的热点问题,分别由不同企业进行命题。黑客松现场将汇聚 200 名来自全球的顶尖开发者进行 36 小时封闭式开发,超过 50 支战队角逐大奖。黑客松颁奖典礼将在世界人工智能大会开发者日上进行颁奖。
不久之前,软银机器人、微众银行、第四范式分别公布了三大赛题,正式启动报名。
我们对部分赛题做了更新,欢迎全球开发者报名参赛。
第四范式:AutoNLP 大赛
2019 世界人工智能大会 WAIC 黑客马拉松——AutoNLP(自动自然语言处理)大赛正式上线。本次比赛是全球首个聚焦 AutoNLP 的大赛,希望参赛选手设计开发全自动的自然语言文本分类系统。作为 NLP 领域中最为热门的课题,自然文本分类广泛存在于各类的应用场景中,对自然文本进行精准分类是解决各个领域中 NLP 问题的核心之一。近年来,深度学习在 NLP 领域取得了长足进展,尤其是利用以 BERT 为首的预训练模型在多个 NLP 任务中获得了远超基线的效果,这也促使了深度学习技术在 NLP 领域需求量的大幅增加。
然而,解决自然语言文本分类的问题需要涉及文本预处理、训练预训练模型,设计分类模型结构,调整模型训练参数等多个步骤,需要经验丰富的专家去实现精细化的模型结构设计和参数调校。人才的稀缺严重阻碍了自然语言文本处理技术被广泛应用到各领域的进程。因此,亟需设计低门槛的自然语言文本分类系统,使得无相关技术经验的开发者也能够快速构建解决不同领域问题的文本分类模型,将该技术应用到更多的领域。
关于比赛
本次 AutoNLP 大赛,希望参赛选手设计开发全自动的自然语言文本分类系统。为了使参与选手开发和评估方案,主办方准备了总共 15 个文本分类数据集,其中包括 5 个离线公共数据集、5 个线上公共数据集(用于盲测,选手无法获得数据集任何信息)、 5 个私有数据集(用于盲测,选手无法获得数据集任何信息)。比赛平台将提供统一配置的 GPU 服务器进行相同环境相同计算资源的测试,并设定每个评测数据集的运行时长。环境预置多种预训练模型,选手也可使用自行训练的预训练模型。大赛共分为两个阶段:
线上预赛:在此阶段,参赛者可以下载离线公共数据集,开发全自动的文本分类系统,实现接收原始未经预处理的文本训练数据、全自动地完成文本预处理、模型结构设计和参数调校等过程。参赛选手将产出文本分类模型上传至平台上,可通过 5 个线上公共数据集评估其 AutoNLP 方案的性能反馈(每天提交次数有限)。线上预赛阶段排名前十的队伍将会被邀请到 8 月底召开的世界人工智能大会现场参与现场决赛。
现场决赛:在此阶段,将测试 AutoNLP 方案在私有数据集的性能,以验证方案的可推广性。该阶段会将方案在没有人工干预的前提下,通过 5 个未经处理的私有数据集进行评估。整个参赛过程选手无法获得与私有评测数据相关的任何信息(包括训练数据也无法获得)。评估结果将决定最终排名,决出获胜队伍。
注:现场决赛开始前,将公布该阶段详细规则。
此次比赛中,参赛选手将面临如下挑战:
如何自动预处理不同语种的文本数据?
如何自动处理长文本和短文本?
如何从文本数据中自动提取有用的特征?
如何自动设计有效的神经网络结构?
如何建立并自动选择有效的预训练模型?
同时,参赛选手需考虑:
如何自动高效地选择恰当的机器学习模型与超参数?
如何提高解决方案的通用性?即如何保证解决方案在未知任务中的适用性?
如何控制计算和内存成本?
赛程设置
8 月 2 日:线上预赛开始&报名
在预赛结束前,均可报名参赛;
报名参赛的选手需先点击「阅读原文」进行相关报名后,再进入比赛平台进行线上预赛。
8 月 21 日:预赛结束&截止报名;
8 月 22 日:宣布预赛排名前十名的队伍;
8 月 29 日:现场决赛开始;
8 月 31 日:现场决赛结束&答辩&公布决赛成绩&颁奖。
奖项设置
第一名奖金:30000
第二名奖金:15000
第三名奖金:5000
线上赛获胜其他队伍奖金:颁发第四范式、Google、ChaLearn 认证的比赛获奖证书
报名链接:
大赛官网:https://www.4paradigm.com/competition/autoNLP2019
比赛平台链接:https://autodl.lri.fr/competitions/35
已通过表单报名参赛的选手可通过大赛官网了解详情,并在比赛平台 CodaLab 上注册,按照说明了解问题设置、数据、提交界面、评估流程后,即可开始线上预赛。主办方为参赛选手提供启动工具包,内含演示数据、基线方法以及在本地环境中模拟生产环境所需的所有物料。
软银:Pepper 人形机器人应用开发大赛
1) 赛题简介:用软银人形机器人 Pepper 创造未来的美好世界。基于软银 Pepper 机器人和提供的 SDK 开发出有趣、实用的机器人应用。
2)团队要求:团队人数为:3-5 人,需要有相关开发经验,至少有一名队员需要会安卓。
3)比赛时间:即日起开启线上报名,8 月 19 日截止线上报名阶段,并进行相关审核,决赛名单 8 月 22 日统一公布。
4)赛前培训:8 月 28 日——29 日 10:00——18:00 软银上海办公司(详细地址及培训内容,将向晋级决赛的选手公布。赛前培训非强制要求,如果无法参加,可以阅读开发文档,自行学习。)
现阶段选手可阅读标准开发文档进行前期赛前准备。决赛团队公布后,会有更为详细的文档发布。
标准开发文档:https://qisdk.softbankrobotics.com
5)奖励:
一等奖(1 名): ¥10,000+一年 Pepper 使用权+软银机器人三级证书
二等奖(1 名):¥ 6,000+六个月 Pepper 使用权+软银机器人三级证书
三等奖(1 名): ¥3,000+三个月 Pepper 使用权+软银机器人三级证书
微众银行:智能垃圾分类挑战赛
1)赛题简介:7 月 1 日起,上海正式实施「最严垃圾分类」。垃圾分类推广初期,面对居民的诸多疑问,「用科技帮助居民进行垃圾分类」就是重要的方向之一。
本次智能垃圾分类挑战赛,聚焦基于深度学习技术的图像分类模型构建,以「智能垃圾分类」为主题,开展在垃圾图片上的人工智能识别,实现垃圾图片类别的精准识别。垃圾的类别分为四类:有害垃圾、可回收垃圾、湿垃圾、干垃圾。
考核技术点:图像分类模型构建
需要提交的内容:模型、docker 环境、代码
2)团队要求:团队人数:1-3 人,需要有相关开发经验。
3)比赛时间:即日起开启线上报名,8 月 19 日截止线上报名阶段,并进行相关审核,决赛名单 8 月 22 日统一公布。
4)奖励:
一等奖(1 名):¥30000
二等奖(1 名):¥15000
三等奖(1 名):¥5000
注意事项:
1、报名「软银机器人:Pepper 人形机器人应用开发大赛」以及「微众银行:智能垃圾分类挑战赛」赛题的选手可选择在阿里巴巴大数据计算引擎和机器学习平台上进行。
「阿里巴巴集团拥有完善的大数据计算基础资源,如大数据计算服务 MaxCompute、实时计算、机器学习 PAI、一站式云端智能研发平台 DataWorks 以及实时大数据可视化产品 DataV。2018 年双 11 狂欢节,离线计算单日数据处理超过 600PB,实时计算历经双 11 流量洪峰考验,实时日志处理峰值每秒 17 亿。支撑多年双 11 数据大屏的 DataV 将为比赛提供高性能实时渲染能力和完整的可视化解决方案。」
2、WAIC2019 黑客马拉松决赛晋级名单将于 8 月 22 日统一对外公布,除「第四范式:AutoNLP 大赛」将以线上预选赛成绩决定晋级名单外,其余的比赛将直接基于报名时所填内容进行初步筛选,挑选出晋级决赛的队伍。
3、此次大赛组委会将不承担选手往返上海的异地差旅费,仅承担黑客马拉松比赛期间(8 月 29 日——8 月 31 日)上海本地交通以及用餐费用,报销凭证请选手自行保存好。
4、现场黑客马拉松场地位于上海张江人工智能岛,比赛期间,选手用餐及休息需在指定区域进行,没有特殊情况,原则上不允许选手离开比赛地点。
点击「阅读原文」报名参赛。