百度和科赛,想让AI与你更近一些

2017年7月,百度正式开放无人驾驶技术平台Apollo、智能语音开放平台DuerOS。同时,百度的无人车也吃到了历史上第一张开给无人驾驶汽车的罚单。


百度大脑每天被调用2188亿次,已开放了超过80个核心的AI能力,已有37万多个合作伙伴加入了百度大脑开放平台。


“All in AI”,是百度2017年扛起的旗帜。


从巨额资金研发投入,到招揽世界级顶尖AI科学家,再到如今AI应用落地——首都机场的“刷脸坐飞机”、雄安新区的城市规划、无人车量产计划,百度的AI生态闭环跃然可见。


而百度想要做的,决不止于此。


Bring AI to Life


11月,百度CEO李彦宏在世界互联网大会上表示,百度将推出Apollo疲劳监测系统,让司机更安全,让家人更安心。


在百度AI人脸识别技术的辅助下,一对七旬老人利用一张身份证照片,找到了走失8个月的儿子。


其实百度PaddlePaddle深度学习开源平台开放一年以来,已在百度30多项主要产品和服务中发挥着巨大的作用,开发者的参与更让百度人工智能如虎添翼。桃子分拣机这类AI产品,是百度技术开放平台的开发者为其他行业的典型助力;一些开发者还开发了诸多“小确幸”的应用:帮助语言障碍者表达的手语翻译器、复原兵马俑原貌的AR.....百度人工智能正在为社会、为个人做着一件件暖心的事情。[1]


“随着人工智能时代的到来,百度希望用人工智能的技术把复杂的世界变得更简单。”


李彦宏在11月百度世界大会上的这句话,其实建立在百度一直以来的一个愿景之上——将AI带入各个行业、将AI带入人们的日常生活、将AI带入我们的现实世界。


The Prerequisites


2017年12月1日,百度在arXiv上发布了一项研究报告,通过实验表明了随着训练数据的增多,只要有足够的训练数据和计算资源,深度学习模型的准确率会有可预期的提高。[2]


在11月百度世界大会 AI 技术与平台论坛上,百度3D视觉首席科学家杨睿刚就宣布推出了百度 AI 公开数据集计划——BROAD(Baidu Research Open-Access Dataset)[3],并宣布首批室外场景理解、视频精彩片段、阅读理解3个数据集即日起对公众公开。


这些数据或是首次发布的,或是目前国际同类型公开数据集中最大的:[4]


  • 室外场景理解数据集是世界范围内第一个带像素级语义标签的室外3D图像数据,来源于百度自动驾驶事业部。该数据集试图将感知能力从物体级感知升级到像素级感知,进而了解图片中所有像素的属性和来源,目标实现更精准、安全的自动驾驶。


  • 视频精彩片段数据集主要来源于爱奇艺。视频类型为综艺节目,目前囊括1500个长视频,视频总时长约1200小时,还从中手动收取出18000个精彩小视频,同时能够提供视频帧的图片特征序列,是全球首创的公开精彩片段标注数据集。


  • 百度阅读理解数据集 DuReader是迄今为止规模最大的中文公开领域阅读理解数据集。数据集基于真实应用需求,所有问题都来源于百度搜索用户的真实问题,文档来自全网真实采样的网页文档和百度知道 UGC 文档,答案基于问题与文档由人工撰写生成。数据集标注了问题类型、实体和观点等丰富信息,弥补了现有主流数据集对于观点类问题覆盖不足的问题。首批发布的阅读理解数据集包含20万问题、100万文档及42万人工撰写的优质答案,并提供开源基线系统。DuReader 将为阅读理解技术研究提供有力支撑,希望加速相关技术和应用的发展。


真实、海量、优质,无疑是对BROAD数据集的准确描述。百度副总裁、AI技术平台体系(AIG)总负责人王海峰这样解读BROAD计划:这些数据全部来自百度AI生态近十年累积的真实数据,开源数据集的目标,就是希望可以这些多年积累的数据公开出来,为认知层、感知层的 AI 技术提供学习驱动,“打造AI生态,从而使得AI技术在百度内外都得到更好地应用。”


The Path


打造AI生态与更好应用,已然成为AI界的高频关键词。


在12月的百度AI生态大会上,百度宣布,欲打造最开放、最平等、最贴心的AI技术生态。


算法、数据、算力、人才、应用场景,这些无不是人工智能发展的基石,而科赛作为百度AI生态的合作伙伴,一直致力聚合优质的算法与各场景的数据资源,再通过科赛打造的K-Lab数据工作平台,配以算力,汇聚AI与数据人才,并为人才的成长发展铺路,从而将AI带入各个行业应用起来。将AI带到人们现实生活的各个角落,也是科赛一直以来的愿景。


因此,我们非常兴奋能够置身其中、做出相应的努力和贡献。


科赛(Kesci.com)是个聚合数据人才和行业问题的在线开放创新平台,现已有数万名专业数据科学家与AI人才加入。


通过为30余家互联网、金融等主流企业客户(如平安、联通、华为、携程、拍拍贷等)提供在算法、(数据/AI)创新应用、新型人才招募上的解决方案,持续吸引优质人才在科赛平台上在线设计并提交5000余份数据算法应用、数据产品创新方案等,鼓励开源了1000余个主流算法模块、5000G真实生产级数据集资源。


基于科赛打造的开放创新平台模式,帮助极大降低企业AI创新成本、加速应用落地,同时更好赋能AI人才进行创新与学习,在实践中更新知识体系、迭代技术能力,满足未来各个行业对数据人才、AI人才的需求。


为了提高数据工作者的工作效率,科赛团队于今年推出了国内首款在线数据工作平台K-Lab [5]。秒级启动,零安装、零维护,集成了Python、R两种主流语言生态的丰富功能,已内置了100多种各语言主流数据分析、机器学习、深度学习工具包,如Numpy, Pandas, Tensorflow, Theano与PaddlePaddle,等等。轻松调用,一键部署环境、标准化代码,还配以强大的云计算资源,能为商业智能、数据分析、机器学习、深度学习等主流分析模块在云端的运行计算提供支撑。因此用户可直接加载科赛上的任意数据,立即开始不论数据分析还是深度学习,可极大提高学习与工作效率。


而今,不仅PaddlePaddle可在K-Lab中直接调用,数百GB的BROAD数据集也可在K-Lab中直接挂载,于是,我们开始聚焦人才与应用吧。


The Competition


许多原来出现在各个如ImageNet这类竞赛平台上的技术,而今,它们的应用已出现在各个行业、生活中的各个角落。


而BROAD数据集的发布,不仅是为一些技术提供更多的数据,不仅仅是希望它能够像ImageNet、COCO、SQuAD这类数据集一样,学术上助力发展这些技术,科赛与百度更是希望那些从BROAD数据集催生的技术、模型,在未来也可以出现在各个行业、生活的各个角落,"bringing AI to life".


因此,现在,百度联合科赛,我们要办个PaddlePaddle AI大赛。



我们希望参赛选手使用PaddlePaddle深度学习框架、利用BROAD数据集、利用K-Lab,着手解决一些行业中的真实问题,从而让AI真正应用于行业、真正服务于行业。


本次大赛将由科赛命题;百度将提供共10万元的奖金池供参赛优秀选手分享,并在第二比赛阶段免费提供强大的GPU计算资源——英伟达深度学习开发卡。届时用户无需任何申请或安装,直接打开K-Lab在其中使用即可。我们希望共同致力于减缓任何AI技术应用化过程中遇到的不平坦。


因此,我们希望身处世界各地的你,不论是学者、人工智能从业者、本科生,还是科研机构、创业团队、学生社团,都能参与进来。如果在未来,某个行业中的一个问题能得益于本次大赛催生的模型,如果在未来,这次的某些模型也能像现在的人脸识别技术一样遍布在身边各个角落了,那我们会感到非常幸运,能在这个过程中出过自己一份绵薄之力。


而对学生而言,这也将会是一次难得的学习机会。一方面在参与的过程中可以体验着手新题、难题的过程,同时也可以对自己的技术、理论基础查漏补缺,更重要的是,本次大赛将鼓励大家公布自己的notebook报告,本着开源的精神,技术共享、学术互助,推动大家共同进步,相信广大学生们也定会受益良多。


众所周知AI对人才的觊觎。


希望这次大赛不仅能汇聚到最优秀的AI人才、解决重要的问题,希望这次大赛也能为培养、挖掘、鼓励未来的AI人才出一份力,更希望大家在这个AI生态中一起 "bring AI to life"!


至此,大家静候赛事发布吧!


更多PaddlePaddle AI大赛详情敬请关注:科赛 Kesci、科赛 Kesci公众号



Reference

[1]http://mp.weixin.qq.com/s/9wJQnjMPmDHiICJjeusIug

[2] https://arxiv.org/abs/1712.00409

[3] https://ai.baidu.com/broad

[4]https://mp.weixin.qq.com/s/aEgl7R7m5-u8sgFiv8C4Tw?scene=25#wechat_redirect

[5] K-Lab说明文档:

https://www.kesci.com/apps/home/project/59e809d76d213335f38e3b8e


「阅读原文」登录科赛 Kesci

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值