9月27日,第九届CCF大数据与计算智能大赛第2批赛题正式上线。至此,第九届CCF大数据与计算智能大赛全面开赛!
自2021年9月16日大赛首批赛题上线以来,选手报名十分踊跃,参赛竞逐也异常激烈。短短两周内,首批上线的13道赛题已吸引5017人报名、组建赛队4127支,聚合了来自全国各地、百余家企事业单位及科研院所的优秀人才。
(首批赛题情况↓,戳图上车)
9月27日,如约上线的第2批赛题都涵盖了哪些企业?发布了什么赛题?奖金多少?一起来看看吧~
CCF BDCI
大/赛/介/绍
中国大数据综合赛事品牌
CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)由中国计算机学会创办于2013年,是大数据与人工智能领域的算法、应用和系统大型挑战赛事。大赛迄今已成功举办八届,累计吸引全球1500余所高校、1800家企事业单位及80余所科研机构的12万余人参与,已成为中国大数据与人工智能领域最具影响力的活动之一。
2021年,第九届CCF BDCI大赛以“数引创新,竞促汇智”为主题,以前沿技术与应用问题为导向,从百度、华为、中原银行等10余家知名企业和科研院所征集了以真实场景为基础的大规模数据,出具图像识别、NLP、数据挖掘、系统优化等不同技术方向的20余道赛题,同时采用在线排行榜自动评测与院士专家评审双管齐下的方式,从大赛中选拔优秀团队及优质人才。
CCF BDCI
不可错过的理由
好处多多 时不我待
欢迎加入群聊。
唔,好多大佬呀~
毕竟这是国家一级学术团体主办的大赛嘛,还有余杭政府支持,而且冲着百万奖金也要战一战。
学生党主要想拿权威证书和奖杯,加个学分……
之前有个学长靠BDCI大奖拿到了一线城市落户名额……
菜鸟一枚,就是想试试自己的水平,也观摩观摩大佬的作战技巧~
也是,开设了好多道训练赛呢,以练备赛以赛促练,早晚告别“菜鸟”,哼!
苦逼创业者(我本人)想要政策扶持和投融资机会,能落地更好
哈哈哈我盯上了你们这些大佬,希望能跟大佬们多交流学习,还有专家院士们……
我更希望大厂爸爸看到我哈哈
啥也不说了,祝大家拿到好成绩!
CCF BDCI
第/2/批/赛/题/详/情
多道赛题 可多选参赛
数据算法赛道
通过算法模型,就某场景或行为的特定指标进行优化。
1
赛题名称:客服通话文本摘要提取
出题单位:中国联通
赛题奖金:¥5万
技术方向:智能算法、文本提取
赛题背景:客服中心每天都要接通大量客户来电,需要进行语音转文本并对文本进行概括,进而提取客户核心诉求,但人工总结会增加客服工作量,降低工作效率,因此期望使用AI算法进行自动的文本摘要生成。
赛题任务:对客户通话数据进行摘要提取,因属于特定领域的通话数据,所以同宽泛性文本摘要提取存在一定差异。
2
赛题名称:系统认证风险趋势预测
出题单位:竹云科技
赛题奖金:¥5万
技术方向:智能算法、风险预测
赛题背景:在当前IAM的探索进程当中,最具可落地性的方法是基于规则的行为分析技术。虽然它的可理解性很高,且很容易与身份鉴别技术进行联动,但它是基于经验的,缺少从数据层面来证明是否有人正在尝试窃取/验证非法获取的身份信息,或正在使用窃取的身份信息。
赛题任务:基于用户认证行为数据及风险异常标记结构,构建用户认证行为特征模型和风险异常评估模型,利用风险评估模型去判断当前用户认证行为是否存在风险。
3
赛题名称:泛在感知数据关联融合计算
出题单位:锐安科技
赛题奖金:¥2万
技术方向:智能算法、性能优化
赛题背景:随着物联网、移动通信、前端感知等技术的高速发展,针对人像、车辆、设备等数据的泛在感知采集正在得到广泛的应用。这些感知手段往往相互独立,难以在前端直接对人、车、物的数据进行有效的关联融合。
赛题任务:根据模拟提供的两种感知手段分别采集的要素数据,通过统计学方法、数据挖掘、图计算等相关算法,将两种数据进行关联融合计算,最终给出两种手段采集到的关键要素之间的对应关系。
先进系统赛道
通过解决方案,提升对指定数据或环境的系统优化能力。
1
赛题名称:基于BERT的大模型容量挑战赛
出题单位:OneFlow一流科技
赛题奖金:¥5万
技术方向:智能算法、性能优化
赛题背景:由于训练大模型对硬件的要求门槛较高,普通用户常常因为硬件条件的限制望而却步。因此,如何利用有限的硬件资源进行大模型训练显得尤为重要。目前,工业界通常采用分布式训练来进行大规模模型的训练,但这些并行需求也为深度学习框架带来了严峻挑战。
赛题任务:基于BERT的原始paper使用TensorFlow、PyTorch和Oneflow三个主流深度学习框架之一进行BERT Large模型的实现,并通过修改隐含层参数量增加其参数量,用来模拟普通用户利用显卡训练等大模型的场景。
创新创业赛道
提交围绕大数据、人工智能、相关技术及其在制造、健康、交通、零售、家居、教育、金融等行业场景的创新项目。
1
赛题名称:2021创业营项目征集
出题单位:杭州市余杭区未来科技城
赛题奖金:¥0,项目落地机会、权威证书
赛题方向:方案应用
征集目的:
培养大赛优秀团队深化创新、精益创业能力,为有意向创业的团队提供展示、学习的专业化舞台;
深入挖掘大赛作品价值,推动项目实际应用落地,多维度探索商业模式;
广泛吸纳全国优秀创新创业项目,搭建沟通合作桥梁,促进政府、投资机构、科研院所与创业者的深度交流平台。
申报范围:
国内外大数据、人工智能、物联网等数字经济相关领域,可较好展现国内大数据创业者精神风貌,具有较高推广价值和示范作用的团队,相关项目具有“技术水平高、应用前景好、市场价值大”的创新企业(已正式成立公司)或初创团队(尚未成立公司)均可报名参赛。
重点围绕大数据相关技术及其在制造、健康、交通、零售、家居、教育、金融、安防、物流等行业场景。
申报时间:
项目征集时间:2021年9月27日-11月30日
决赛评审时间:2021年12月1日-12月5日
注意:具体决赛评审时间可能根据实际情况做出调整。
奖励机制:
创业赛设一二三等奖及优秀奖共10个团队。
落地政策:入围决赛评审的团队,经过评审后有机会享受杭州市余杭区未来科技城梦想小镇落地政策;
权威证书:本赛道一二三等奖获奖团队将获得由中国计算机学会颁发的权威获奖证书、奖牌,优秀奖获奖团队将获得证书;
政策扶持:其他优秀团队经组委会及承办单位评审后,符合相应条件的,有机会获得相关政策支持;
项目投资:优秀创新创业项目,有机会在决赛现场获得来自多家政府及知名投资的项产融投资对接。
训练助力赛道
根据公开数据集,出具自然语言处理、图像识别、分类预测等不同方向的低难度赛题,辅助参赛者学习。
1
赛题名称:船舶航行轨迹预测
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、机器学习
赛题背景:相关海事部门和船舶交通服务系统提高决策水平面临的一个关键问题就是实现船舶航迹预测。目前,大多数船舶轨迹预测模型还停留在基于特定运动学方程的模型上,受限程度较高,很难应对当今繁杂的海上交通情形。
赛题任务:依据真实船舶历史航行轨迹数据,利用机器学习相关技术,建立船舶轨迹预测模型,预测船舶下一时间段的航行轨迹。
2
赛题名称:渔船作业方式识别
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、机器学习
赛题背景:海洋捕捞渔船作业类型分为多种,但违规捕捞作业将会对海洋生态环境和渔业资源产生严重的影响,也给渔业管理带来困难。因此需要依据真实渔船轨迹数据利用机器学习相关技术,建立稳健的渔船作业方式识别模型,用于准确识别渔船的作业方式。
赛题任务:依据真实渔船轨迹数据,利用机器学习相关技术,建立稳健的渔船作业方式识别模型,有效识别渔船的作业方式。
3
赛题名称:法律领域篇章级多事件检测
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、文本摘要
赛题背景:为帮助司法办案人员快速理清案件、掌握案件中包含哪些类型的事件,需要依据真实存在的法律案件信息,利用机器学习等相关技术,建立稳健的事件检测模型,为后续抽取各事件所涉及的元素提供有利信息。
赛题任务:利用机器学习、深度学习等相关技术,建立稳健的篇章级多事件检测模型,解决事件检测任务中事件触发词不明显等问题,有效判断一个真实发生的婚姻家庭类法律案件中包含多少事件以及对应的事件类型。
4
赛题名称:图书推荐系统
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、机器学习
赛题背景:为帮助电商系统识别用户需求,为用户提供其更感兴趣的信息,打造更好的服务体验,需要依据真实的图书阅读数据集,利用机器学习的相关技术,建立一个图书推荐系统。
赛题任务:依据真实世界中的用户-图书交互记录,利用机器学习相关技术,建立一个精确稳定的图书推荐系统,预测用户可能会进行阅读的书籍。
5
赛题名称:新闻摘要自动生成
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、文本摘要
赛题背景:随着互联网、社交媒体的迅速发展,各类新闻文章层出不穷,读者在面对海量信息时,难以有效发现哪些新闻自己感兴趣的新闻内容。
赛题任务:依据真实的新闻文章,利用机器学习相关技术,建立高效的摘要生成模型,为新闻文档生成相应的内容摘要。
6
赛题名称:出租车发票识别
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、图像识别
赛题背景:出租车发票在日常财务发票报销中较为常见,由于样式丰富、区域性特点明显,并且包含大量模糊字迹和错位字迹,因此准确定位发票文字字段、识别文字和结构化输出显得十分重要。
赛题任务:利用图像处理、机器学习、深度学习等方法训练出租车发票的文字检测,识别模型,并实现识别结果的结构化输出。
7
赛题名称:机器翻译领域适应
出题单位:中国计算机学会
奖金奖项:¥0,CCF会员名额、电子证书
技术方向:智能算法、机器翻译
赛题背景:具有丰富数据资源领域的机器翻译性能不断提高,但是由于数据资源获取困难等原因,某些特殊领域的翻译效果还不够理想。如何利用富资源领域的数据帮助低资源领域提升翻译质量是一个热点研究问题。
赛题任务:面向低资源神经机器翻译的领域适应方法研究,提供数据训练样本,参赛队伍需要基于提供的训练样本进行中到英机器翻译模型的构建与训练,并基于口语、专利、医药三个领域测试集分别提供翻译结果。
CCF BDCI
赛/程/赛/制
看准时间 不要错过~
#1
大赛初赛(线上)
#
9月16日
首批赛题发布,同时开放报名
#
9月27日
第二批赛题发布,同时开放报名
#
11月20日
初赛A榜截止(报名、作品提交及评测)
#
11月22日
初赛B榜作品提交及评测,仅开放一天
#2
大赛决赛(线上)
#
12月3日
代码复现、晋级资格审核
#
12月4日—5日
决赛答辩评审
#3
大赛总决赛(线下)
#
12月中旬
线下总决赛,答辩评审及颁奖典礼
CCF BDCI
大/赛/活/动
活动丰富多样,展现大赛风采
助学特别计划
9月至11月,联合百所高校共同就训练赛题进行系统学习、训练,辅助教学与能力测试。
《CCF BDCI大咖说》系列专题报告
10月至11月,邀请CCF各专委专家进行相关技术方向的线上报告,讲述大数据及人工智能的算法及产业应用。
走进高校
9月下旬至11月,通过多种形式,走进20余所高校,邀请大数据及人工智能领域知名专家及企业,做大赛相关技术专题报告。
产学研线上沙龙
9月下旬至11月,邀请企业、相关领域专家、参赛者通过视频直播的形式进行人才交流、赛题答疑与线上互动。
决赛嘉年华
12月中下旬,邀请决赛入围团队现场答辩评审,举办数据科学家之夜、大数据及计算智能高峰论坛、颁奖盛典等活动。
CCF BDCI
大/咖/说/阵/容
院士专家 顶级大咖
大赛特邀中国计算机学会(CCF)的各位专家老师展开“大咖说”专题分享报告,为广大技术发烧友及大赛参赛者提供一个吸收学术知识、深入碰撞交流的高端平台。
专家老师们将根据自身研究方向,结合当下社会背景、行业背景及正在攻克的行业难题,分别从人工智能、隐私安全、图计算、机器学习、高性能、深度学习、算法预测等技术方向,讲述学术研究、产业发展的内驱动力和实践价值。
陈晋鹏
北京邮电大学计算机学院(国家示范性软件学院)副教授,博士生导师
主讲专题:《智能探空网络中探空仪轨迹预测研究》
甘新标
国产超级计算机系统副主任设计师副研究员
主讲专题:《Graph in the world》
贾海鹏
中国科学院计算技术研究所 高级工程师
主讲专题:《BLAS与FFT性能优化关键技术》
贾伟乐
中国科学院计算技术研究所副研究员
主讲专题:《智能科学计算》
鲁斌
华北电力大学计算机系主任
主讲专题:《智慧变电站数字孪生平台的建设与发展》
李光亚
万达信息股份有限公司董事、高级副总裁
主讲专题:《多元证照票据的智能识别技术及跨行业应用》
骆嘉伟
湖南大学信息科学与工程学院教授、副书记
主讲专题:《基于图机器学习的微生物网络关系预测算法研究》
刘晶
河北省数据驱动工业智能工程研究中心主任
主讲专题:《大数据助力智能制造》
马艳军
百度深度学习技术平台部高级总监
主讲专题:《产业级深度学习开源开放平台的实践与探索》
王志波
浙江大学计算机学院教授
浙江大学网络空间安全学院教授
主讲专题:《让分享更安全--抗压缩“隐形衣”》
张清华
重庆邮电大学旅游多源数据感知与决策技术文化和旅游部重点实验室副主任、科技处处长
主讲专题:《人工智能发展的内驱动力》
周霞
中石化地球物理公司信息化专家
主讲专题:《2021人工智能在地震勘探采集视频分析中的应用》
朱效民
山东省齐鲁大数据研究院院长
主讲专题:《深入浅出经济社会运行大数据分析》
曾艳
杭州电子科技大学计算机学院副教授
主讲专题:《大规模AI模型分布式自适应训练与调优技术》
(以上专家按姓氏首字母排序)
《CCF BDCI大咖说》系列专题报告将于10月11日准时上线,每周一、周五,公众号「一碗数据汤」与你不见不散~
CCF BDCI
组/织/架/构
多方协同 保驾护航
政产学研多方合作,共同为大赛保驾护航。
主办单位:中国计算机学会
支持单位:杭州市余杭区人民政府
承办单位:浙江杭州未来科技城管理委员会、CCF大数据专家委员会、CCF自然语言处理专业委员会、CCF高性能计算专业委员会、CCF计算机安全专业委员会、CCF计算机应用专业委员会、教育部易班发展中心、LandInn、数联众创
独家战略合作:百度
创新合作:华为
赛道合作:360集团未来安全研究院、中原银行、中国中文信息学会
赛题合作:明朝万达、高德地图、竹云、爱奇艺、OneFlow一流科技、中国联通、GeaGraph、浙江省发展和改革委员会、锐安科技
合作媒体:学术世界
官方竞赛平台:DataFountain
CCF BDCI
报/名/参/赛
别犹豫,就现在!
大赛面向社会各界开放,不限年龄、国籍,高校、科研院所、企业从业人员均可登录大赛官方竞赛平台DataFountain官网报名参赛。
报名方式
大赛直达链接:http://navo.top/AbE3Yn
戳左下角“阅读原文”直通大赛,电脑端打开更方便哦~
长按扫码,一键直达↓↓↓
竞赛交流群
欢迎扫描下方二维码,加入BDCI大赛交流群,和更多小伙伴一起在线组队、竞技交流。我们将持续在群内分享赛题解读、baseline开源、开放评测、获奖方案等赛事后续动态~
(入群失败请联系小助手dfxzl01或dfxzl02)
2021 CCF BDCI征集令
2021 CCF BDCI正式赛已于9月16日正式开赛!即日起,大赛同步开启赛事多维招募,虚位以待,欢迎加入!
招募选手
所有关注大数据与人工智能的挑战者,欢迎推荐和自荐参赛选手或团队报名参赛,国家级赛事等你破题!
征集赛题
诚邀更多政企单位加入,任何有关大数据与人工智能的真实需求和业务痛难点,都有可能成为赛点。邀您共商、让全球万名数据专家为你解决企业真实难题~
教学结合
诚邀高校老师入队,鼓励学生参赛,让教学与竞赛结合,检验能力同时获取荣誉与奖金。我们将持续提供计算资源、学习环境与赛况反馈。
走进高校
诚邀更多专家院士加入组织,一起走进高校,展开前沿技术报告,结合大赛答疑解惑。
社群合作
诚邀更多数据科学社群入“伙”,让这一权威赛事惠及更多垂直领域专业伙伴。
创业合作
创业赛道将为有投融资需求的企业/个人搭建交流机会,诚邀各方伙伴联动发布更多创业/创意赛题~
资源合作
期待与您深度合作,通过活动组织、宣传推广、资源渠道等多种灵活形式,共建互惠合作模式。
联系我们
contact@datafountain.cn
戳“阅读原文”
速上大赛直通车~
↓↓↓