点击左上方蓝字关注我们
“有多少智能,就有多少人工”。在AI高速发展的今天,数据标注产业逐渐浮现于人们眼前,上面这句话便是数据标注行业里最广为人知的一句。事实上,这句话绝非危言耸听。
据统计,我国从事数据标注工作的人员早已突破千万,甚至大量的AI头部企业还会专门注册单独的数据标注相关企业。可以说,海量数据标注人员付出的人力,成为AI事业蓬勃发展的基石。但是,这样的人力成本是否会成为AI产业进一步发展的桎梏?
数据是人工智能的血液,但只有数据还远远不够,需要添加了标签的数据,才能帮助机器学习和进化。然而,面对海量的人工标注成本,如何降低数据标注工作量,提升标注效率,已经成为当下业界的重要课题。由于无监督学习对技术的要求更为苛刻,再加上深度学习算法模型对大数据的需求有增无减,半监督学习不失为当下更合适的解决方案。
虽然上述两种方法都能减少机器学习对数据标注的需求量,但当标注数据较少时,模型训练更容易出现过拟合问题,因此半监督学习仅可在数据结构不变的情况下,从有限的训练集推广到无限不可见的集合。
由于使用少量标注数据就可以完成模型训练过程,半监督学习已经越来越适用于现实场景中的各类任务。本次由中国人工智能学会主办、百度承办的第三届中国AI+创新创业大赛便设立了半监督学习目标定位竞赛分赛道,以比赛形式锁定半监督学习破局要点,为中国AI产业发展挖掘更多优秀人才,协力突破数据标注迷局。开赛钟声已经响起,快来与各路高手一起挑战技术极限吧!
赛题简介
本次半监督学习目标定位竞赛,要求选手基于少量有标注数据训练模型,使分类网络具有目标定位能力,实现半监督目标定位任务。每一位参赛选手仅可以使用ImageNet大型视觉识别竞赛(ILSVRC)的训练集图像作为训练数据,训练数据集包括50,000幅像素级有标注的图像,共包含500个类,每个类100幅图像,其中有标注的训练数据仅可以使用大赛组委会提供的像素级标注数据。
本次比赛使用IoU曲线作为评价指标,即利用预测的目标的定位概率图,计算不同阈值下预测结果与真实目标之间的IoU分数,最后取一个最高点作为最终的分数。在理想状态下,IoU曲线最高值接近1.0,对应的阈值为255,因为阈值越高,目标对象与背景的对比度越高。
????点击加入比赛交流群
比赛福利
✓ 冠军20,000元人民币奖金
✓ 报名即送100h GPU算力
✓ ImageNet数据集免费下载
✓ 官方基线一键fork
????????扫码报名,比赛福利马上获取!
奖项设置
名称 | 数量 | 奖金 |
一等奖 | 1 | 2万元人民币+荣誉证书 |
二等奖 | 2 | 1万元人民币+荣誉证书 |
三等奖 | 2 | 5千元人民币+荣誉证书 |
优胜奖 | 5 | 百度牛年熊公仔+荣誉证书 |
关于比赛
中国“AI+”创新创业大赛由中国人工智能学会主办,是为了配合实施创新驱动助力工程,深入开展服务企业技术创新活动,进一步提高我国文化建设和实践创新能力,展示智能科学与技术等相关学科建设的新经验、新成果,促进专业内涵的建设而发起的综合性大赛平台。
飞桨PaddlePaddle作为中国首个开源最早、技术领先的产业级深度学习平台,为本次比赛的参赛选手提供了集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体的一站式服务。百度大脑AI Studio作为官方指定且唯一的竞赛日常训练平台,为参赛选手提供高效的学习和开发环境,更有亿元Tesla V100算力免费赠送,助力选手取得优异成绩。
人工智能的发展是技术的迭代,也是效能的提升。但如果AI不能离开人工,那么效能的提升必然无法逃离枷锁的束缚。随着半监督学习技术的逐渐发展与成熟,未来的数据标注产业必将焕然一新,AI的发展速度也有望更上一层楼。如果你愿意以己之力推动AI模型训练模式的升级,挑战少量标注数据训练的极限,那就报名参赛,挖掘你的无限潜能吧!
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体,是中国首个开源最早、技术领先的产业级深度学习平台。飞桨企业版针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END