本周AI热点回顾:百度推出全球首个mRNA疫苗不稳定性解决方案、性能提升20倍:英伟达GPU旗舰A100...

01

百度推出全球首个mRNA疫苗不稳定性解决方案LinearDesign

新冠疫情爆发后,RNA设计领域世界知名专家、斯坦福大学生物化学系Rhiju Das教授关注到疫苗研发存在的一个非常棘手的问题:找到一个既具有稳定二级结构,而且还有效的mRNA疫苗,很困难。

首先是稳定性,mRNA疫苗“脆弱”到在保存、运输过程中,就有可能因为降解而失效。然后是有效性,需要找一个mRNA序列,能够翻译成特定的蛋白质(抗原)。单是满足这两个条件,若是采用遍历的方式去寻找,那就需要查看10632个mRNA序列!

这是什么概念?用一台超级计算机来处理,即便一秒钟能计算一个新冠RNA序列的二级结构,哪怕是从宇宙诞生到现在(130-140亿年),连“潜在”mRNA序列的亿万分之一都没算到。

于是乎,Rhiju Das教授便找到了百度,使用百度此前开源的LinearFold算法,搭建一个疫苗设计公开赛,让全民参与进来,以游戏的形式,边玩边找这个mRNA。

首先主要面临的问题,就是如何解决如此庞大的搜索空间。LinearDesign通过动态规划算法,来将这一问题的搜索空间从指数级降低到多项式级。

具体来说,首先用确定有限状态自动机(DFA)来表达氨基酸和蛋白质,这样不同位置上密码子的选择就可以抽象为计算理论中常用的DFA图。如下图,分别把三种氨基酸(A: methionine, B: valine, C: serine)以及终止密码子(D)抽象为DFA图。

在有了DFA图后,要通过DFA找出二级结构最稳定的mRNA序列。这里借用了计算语言学中常用的一个工具,随机上下文无关语法(SCFG)。RNA二级结构可以通过SCFG构建语法树来表示。mRNA疫苗序列设计优化问题实际上是将单个RNA序列的二级结构计算(RNAfolding)推广到多个RNA序列。在用DFA抽象表示多个RNA序列后,研究人员通过取DFA与SCFG的交集,来从多个mRNA序列中找到具有最稳定二级结构的序列。

下图给出了一个具体的例子,通过DFA和SCFG相交,生成出序列“methionine leucine stop”最优的mRNA序列为“AUGCUGUGA”。

LinearDesign 论文地址:(https://arxiv.org/abs/2004.10177

LinearDesign 网站链接:(http://rna.baidu.com/)

CoV-Seq论文地址:

(https://www.biorxiv.org/content/10.1101/2020.05.01.071050v1)

CoV-Seq网站链接:(http://covseq.baidu.com/)

信息来源:量子位

02

WAVE SUMMIT 2020 深度学习开发者峰会定档 5.20

定档5月20日召开的“WAVE SUMMIT 2020”深度学习开发者峰会官网正式上线,广大科研院所、高校、企业的开发者和个人均可注册报名,提前锁定这场深度学习领域国内最顶级的极客盛会。

“WAVE SUMMIT 2020”深度学习开发者峰会是由深度学习技术及应用国家工程实验室与百度联合主办,来自百度、英特尔等公司的人工智能专家将分享深度学习时代的最新技术发展与产业落地经验。

本次峰会将采取线上直播的形式召开。5月20日主论坛于上午十点开始,下午还有六节公开课。百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰将做开场致辞。百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜将带来主题演讲。

为了普及深度学习,让更多公众也能参与体验,官网还专门设置了互动大厅,在这里有趣味的AI互动游戏,例如尝试用AI科技生成头像直接穿越二次元,更有刺激的“避障,飞桨破浪”等你来冒险。甚至还有积分兑换、抽奖活动。

前5000名注册用户有机会参与抽取Airpods2代耳机等奖品;登录互动赚取积分,兑换充满极客范的手账本、主题T恤衫等。

除了有这场盛大的峰会之外,还有“百度架构师手把手带你零基础入门深度学习”系列课程的最新内容,快速掌握模型应用、工业部署与训练以及二次开发;AI快车道PaddleCV系列课程,助力企业在AI时代高效应用深度学习技术;零门槛AI开发平台EasyDL系列课程,结合行业与场景痛点的深度学习企业应用型课程。深度学习主题月为开发者们呈上直播盛宴,几乎每天都有精选主题分享内容供不同技术方向和层次的开发者们选用。

扫码下方二维码关注公众号,发送口令“峰会”,即可加入官方微信群:

点击文末“阅读原文“即可进入“WAVE SUMMIT 2020”深度学习开发者峰会官网,立即报名参加吧。

信息来源:飞桨PaddlePaddle

03

性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉

虽然因为新冠疫情爆发,今年的 GTC 2020 大会也在最后时刻宣布转为线上,不过人们期待 7 纳米制程英伟达 GPU 的热情并没有消退。英伟达当然理解我们的心情,在 GTC 正式开幕一天前,英伟达 CEO 黄仁勋提前放出了一段视频——在老黄美国加州 Los Altos Hills 的家中,全球最大的 GPU 正式「出炉」了:

事实上,黄仁勋今年的整个 GTC 大会的主 Keynote 环节都是在这个烤炉前进行的。他还表示,这是英伟达有史以来第一个「厨房 Keynote」。

黄老板展示的安培(Ampere)架构 GPU 系统以最新英伟达 Tesla A100 芯片组成,被认为是迄今为止 GPU 算力最大的一步提升。

具体提升了多少?还记得三年前推出、至今仍然业界领先的 Volta 架构芯片 Tesla V100 吗?V100 用 300W 功率提供了 7.8TFLOPS 的推断算力,有 210 亿个晶体管,但 A100 的算力直接是前者的 20 倍。

「A100 是迄今为止人类制造出的最大 7 纳米制程芯片,」黄仁勋说道。A100 采用目前最先进的台积电(TSMC)7 纳米工艺,拥有 540 亿个晶体管,它是一块 3D 堆叠芯片,面积高达 826mm^2,GPU 的最大功率达到了 400W。

这块 GPU 上搭载了容量 40G 的三星 HBM2 显存(比 DDR5 速度还快得多,就是很贵),第三代 Tensor Core。同时它的并联效率也有了巨大提升,其采用带宽 600GB/s 的新版 NVLink,几乎达到了 10 倍 PCIE 互联速度。

信息来源:机器之心

04

隔空抠图+跨设备复制粘贴,CV 技术加持下的 AR 实现了!

「 AI 开始变魔术了 」

一位名叫 Cyril Diagne 的法国人利用机器学习+AR 技术,实现了“在一台电脑上按下 Ctrl+C 在另一台电脑上按下 Ctrl+V 就能进行跨设备粘贴复制”的传说中的操作。

该功能目前仅能用于 Photoshop,但作者相信未来可以处理更加不同类型的输出。从粘贴到复制,完成整个过程需要三个模块:移动 APP、本地服务器、背景移除。

其中,移动 APP 使用了 Expo 这个通用的 React 应用架构和平台搭建,本地服务器使用了 ScreenPoint 超早摄像头在屏幕上所指向的位置,背景移除使用的技术是基于被 Pattern Recognition 2020 收录的论文《U^2-Net: Going Deeper with Nested U-Structure for Salient Object Detection》。目前此论文尚未找到下载版本,不过论文代码已经放出。

原文链接:

(https://www.leiphone.com/news/202005/uZrdIAgE0kMhcsgB.html)

项目地址:

(https://github.com/cyrildiagne/ar-cutpaste)

代码地址:

(https://github.com/NathanUA/U-2-Net)

信息来源:百度AI

05

本周论文推荐

【ACL 2020 | 百度】:预训练表示学习SKEP

SKEP: Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis

论文介绍:

近年来,随着预训练语言模型的快速发展,情感分析等多项自然语言理解任务都取得了显著的效果提升。然而,在通用语言模型预训练中,文本中的很多情感相关的知识和信息,例如情感词、实体-评论搭配等,并没有被模型充分的学习。

基于此,百度提出了一种情感知识增强的语言模型预训练方法,在通用预训练的基础上,设计了面向情感知识建模的 Masking 策略和情感多目标学习算法,融合了情感词、极性、主体评论关系等多层情感知识,首次实现了情感任务统一的文本预训练表示学习。

该算法在情感分类、观点抽取等情感分析任务中相对主流预训练模型RoBERTa有显著的提升,同时刷新了多个情感分析标准测试集的世界最好水平。

END

● 深度学习开发者峰会报名

由深度学习技术及应用国家工程实验室与百度联合主办的“WAVE SUMMIT”2020深度学习开发者峰会将于5月20日召开,并首次采用线上直播的方式举办,本次峰会飞桨将发布核心框架的重要升级,并有多项新品发布及重磅升级,还等什么,快上官网注册吧:

https://www.wavesummit.com.cn/

前5000名注册用户将有机会获得大奖哦!

展开阅读全文

没有更多推荐了,返回首页

应支付0元
点击重新获取
扫码支付

支付成功即可阅读