召唤AI大神与病毒作战!Kaggle发起CORD-19数据集文本挖掘竞赛

点击我爱计算机视觉标星,更快获取CVML新技术


本文转自新智元。


  新智元报道  

来源:Kaggle

编辑:王芳,元子

【新智元导读】对抗冠状病毒,岂可少了AI?近日,艾伦AI研究所等顶级研究小组发布了免费的COVID-19开放研究数据集,涵盖目前所有的冠状病毒研究文献,Kaggle紧跟着发起CORD-19数据集文本挖掘竞赛,提出10大难题,召唤AI研究人员开发文本数据挖掘工具助力医学界。

根据世界卫生组织最新统计数据,截止目前,冠状病毒全球感染人数至少为168019人,死亡人数已达6610人。特朗普在周一的简报中表示,美国COVID-19病毒感染和死亡人数持续上升,也许最早可在七八月份控制新型冠状病毒。

对抗冠状病毒岂可少了AI助力,近日AI界提出了应对冠状病毒的新举措。

艾伦AI研究所等发布COVID-19开放研究数据集

为了应对COVID-19所引发的新型肺炎,以艾伦AI研究所为代表的研究小组决定发动大招,集结众人之力破解冠状病毒的前世今生。

近日,艾伦AI研究所联合微软研究院、美国国立卫生研究院(NIH)国家医学图书馆、白宫科学技术办公室(OSTP)等顶尖研究小组发布了COVID-19开放研究数据集(COVID-19 Open Research Dataset ,CORD-19),该数据集免费提供了29000篇与冠状病毒整个家族相关的学术文章,其中还有13000多篇全文文献,该数据库将随着最新研究成果每周更新,更新内容涵盖同行评审出版物上刊登的最新研究和bioRxiv、medRxiv等档案库中的新内容,目前的文献截止到3月13日。

当然数据集不是为了发布而发布,而是为了挖掘而发布,毕竟面对浩如烟海的数据和更新飞快的研究,文献放在那里作用是有限的。

微软首席科学家埃里克·霍维茨(Eric Horvitz)表示:"我们创建这一开放数据集的目标是激发AI社区创建可以帮助科学家掌握数千篇文章的工具,以使科学技术能够研发出应对COVID-19的方法"。

详见:

https://pages.semanticscholar.org/coronavirus-research

Kaggle发起CORD-19数据集文本挖掘竞赛

COVID-19开放研究数据集发布之后,Kaggle立即发起CORD-19数据集文本挖掘竞赛,召唤AI大神!

"我们正在向全球的人工智能专家发出开发文本和数据挖掘工具的号召,以此帮助医学界为一些高度优先级的科学问题找到答案,CORD-19数据集代表了迄今为止可用于数据挖掘的最广泛的机器可读冠状病毒文献集,这使全球AI研究社区有机会应用文本和数据挖掘方法来查找问题答案,并在各部分内容间形成见解,以此来支持全球正在进行的CORD-19相应工作。数据挖掘工具需求紧迫,因为日益增加的冠状病毒研究成果让医学界难以应对。"

10个待挖掘的关键问题

为帮AI大神指明数据挖掘方向,Kaggle在官网公布了10个现阶段的关键问题:

  1. 对冠状病毒传播、潜伏和环境稳定性了解多少?

  2. 对COVID-19的危险因素了解多少?

  3. 对冠状病毒的遗传学、起源和进化了解多少?

  4. 需要提交样本的样本任务——帮助了解地理位置如何影响病毒传播

  5. 目前已经发表的医疗保健相关内容?

  6. 目前已发表的出于伦理和社会科学考虑的内容有什么?

  7. 目前已经发表的在信息共享和跨部门合作方面的内容有什么?

  8. 目前对非药物干预了解多少?

  9. 对疫苗和治疗方法了解多少?

  10. 对疾病的诊断和监控了解多少?

上述10个问题关键问题来源于美国国家科学工程医学研究院下设的新兴传染病和21世纪健康威胁委员会的研究主题和世界卫生组织针对COVID-19的研发蓝图。

奖金

Kaggle将为每个任务中最符合评估标准的获奖人员提供1000美元的奖金,奖金可以以现金形式发放,也可以作为慈善捐款捐给COVID-19救济研究工作。

NLP将助力人类攻克更多医学难题

有机器学习专家表示,基于Transformer的文本生成和NLP的发展是2019年最重要的人工智能发展之一,并且2020年将会有更大进步。

艾伦AI研究所所长Oren Etzioni表示,人工智能可以加速进步并帮助发掘问题答案,但他强调,人工智能会增强人的能力,人工智能本身不能解决问题。

目前使用NLP对抗冠状病毒的组织已经不在少数:

  • 哈佛医学院开发出开发出的NLP工具可审阅患者记录、社交媒体和公共卫生数据等资料;

  • 一家名为BlueDot的公司更是通过NLP检索新闻、公共健康数据先于世界卫生组织预警了冠状病毒的爆发;

  • 阿里达摩院前一段时间发布的NLP模型StructBERT荣登通用语言理解评估(GLUE)基准排名榜首,阿里也将此NLP应用用在疾控中心进行病历文本分析和流行病学调查。

凡此种种,全球科技界的共同努力,让我们相信一定可以共克时艰,攻克冠状病毒。

比赛官网:

https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge


竞赛交流群

关注最新、最前沿的机器学习、计算机视觉、数据挖掘和NLP等竞赛信息,扫码添加CV君拉你入群,如已为CV君其他账号好友请直接私信,

(请务必注明:竞赛):

喜欢在QQ交流的童鞋可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过还请见谅)


长按关注我爱计算机视觉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值