点击左上方蓝字关注我们
01
「时空版」Transformer训练速度远超3D CNN,提速3倍!
Facebook AI推出了全新的视频理解架构TimeSformer,这也是第一个完全基于Transformer的视频架构。视频剪辑上限可达几分钟,远远超过当下最好的3D CNN,且成本更低。
TimeSformer即Time-Space Transformer,这是第一个完全基于Transformer的视频架构,近年来已经成为许多自然语言处理(NLP)应用程序的主要方法,包括机器翻译和通用语言理解。
论文链接:https://arxiv.org/pdf/2102.05095.pdf
TimeSformer 在几个难度系数比较高的动作识别基准上获得了最好的效果,包括 Kinetics-400动作识别数据集。此外,与现代3D 卷积神经网络(CNN)相比,TimeSformer 的训练速度提高了大约3倍,推理所需计算量不到原来的十分之一。这是支持需要实时或按需处理视频的应用程序的重要一步。
此外,TimeSformer具有可伸缩性,可以用来训练更长的视频剪辑中的更大模型。这使得人工智能系统可以理解视频中更复杂的人类行为,例如涉及多个原子步骤的活动(修理汽车,准备食物等)。许多需要理解复杂人类行为的人工智能应用程序都能从中获益。
TimeSformer 与先进的3D 卷积神经网络在 Kinetics-400(左)和 Kinetics-600(右)动作识别基准上的视频分类精度。TimeSformer在两个数据集上都实现了最高的准确度。
信息来源:新智元
02
实时风格迁移,移动端运行,人脸特效又有了新玩法
人脸风格迁移出现新玩法!捷克理工大学联合 Snap 公司创建了一个用于视频中人脸风格实时迁移的框架,既不需要大型数据集和冗长训练周期,更能够在移动端运行。
今年,人脸视频特效在全球又大火特火了一把。年初的「蚂蚁牙黑」(人脸唱歌),还有不久前让老照片动起来的特效,效果都十分惊艳。
风格迁移一直是图像领域的热门方向。那么在视频上做实时人脸画风迁移效果怎么样呢?
是这样的:
当然,视频画风迁移并不是什么新鲜技术了。但这项研究最大的特点在于:移动端、实时,由布拉格捷克理工大学和 Snap 公司的研究者联合完成。目前已经放出了完整论文,相关代码将于下月发布。
项目地址:https://ondrejtexler.github.io/faceblit/
论文地址:https://ondrejtexler.github.io/res/faceblit-paper.pdf
具体而言,研究者提出了一种基于实例的实时视频人脸风格迁移框架 FaceBlit,该框架通过语义上有意义的方式保留了风格的纹理细节,也就是说,用于描绘特定风格特征的笔画出现在目标图像的适当位置。
与以往风格迁移方法相比,该框架不仅保留了目标对象(target subject)的身份,而且不需要大型数据集和冗长训练周期即可实现实时运行。
为此,研究者修改了 Fišer 等人(2017 年)的人脸风格化 pipeline,这样快速生成一组指引通道(guiding channel),不仅可以保留了目标对象的身份,还兼容 Sýkora 等人(2019 年)的基于 patch 合成算法的速度更快变体。
得益于这些方法上的改进,研究者创建了首个即使在移动端,也可以将单个肖像的艺术风格实时迁移至目标视频中人脸的系统框架。
信息来源:机器之心
03
ONNX开发者大会即将召开,百度飞桨与LF AI & Data共同承办
北京时间3月25日上午8点,百度飞桨与LF AI & Data基金会共同承办的2021年ONNX开发者大会(ONNX Community Virtual Meetup 2021)即将重磅开启,面向全球开发者进行线上直播,无论是热衷钻研开源技术,还是探索AI应用落地的开发者们,都将从大会中获取干货与灵感。
本次ONNX开发者大会将由百度飞桨主持,由来自微软、英特尔等合作企业的嘉宾分享基于ONNX的部署、新应用场景等最新信息,以及SIG和WGs更新及应用。大会规格将在往届基础上再次升级,吸引超过80家品牌及近千位开发者参与。此次大会将在B站及CSDN的“飞桨PaddlePaddle”账号进行全球直播,观众可通过弹幕互动随时进入会议的分享讨论。
在飞桨框架2.0正式版发布之际,飞桨与LF&AI密切合作,积极投入到ONNX社区的开源建设之中。
来自百度飞桨的高级产品经理王运凯(Wranky Wang)将分享飞桨产品与ONNX的深入融合。X2Paddle可以将ONNX模型转为飞桨模型,既能丰富飞桨的模型库,也可以通过飞桨推理引擎Paddle Lite实现部署。Paddle2ONNX则实现了将飞桨生态的模型转为ONNX,进一步地,能够在Nvidia,Intel,Adlik等产品上实现部署,从而让飞桨模型部署在更广泛的硬件之上。
信息来源:飞桨PaddlePaddle
04
GitLab成立中国合资公司极狐,强调“独立运营”
还没等来GitHub,倒是GitLab先传来了正式进军中国市场的消息。
根据最新报道,这家全球第二大开源代码托管平台,现在已经与投资方红杉宽带和高成资本,合作成立了一家中国合资公司——极狐信息技术(湖北)有限公司。
该公司目前已经完成首轮数亿元融资。
GitLab公司联合创始人兼CEO Sid Sijbrandij对此表示:
我们一直期待以适应中国企业需求的本地化方式,扩大GitLab开源软件在中国的使用和访问量。
通过与红杉宽带和高成资本的合作,极狐公司将在战略、技术、产品、定价和运营层面获得完整的自主权。
强调“独立运营”
那么具体是怎么个“本地化”法?
根据官方介绍,GitLab会与极狐公司签署授权协议,约定向极狐公司提供独家知识产权和品牌授权,保持源代码同步持续更新。
另外,极狐还会自主研发并独立运营GitLab CN开源代码库,推出GitLab中国发行版GitLab JH,“实现100%的国产化独立运营”。
此前,红杉宽带就曾经以外方提供技术、产品和品牌,红杉宽带提供资金和本地资源,本地管理层负责运营的模式,将印象笔记引入中国本土。
而根据天眼查信息,在股份比例分配上,GitLab占比为72.25%,红杉宽带占比18.75%,高成资本占比9%。
另外,此次出任GitLab中国公司掌门人的陈冉,亦是中国开源业界的资深专家。
他是DC/OS 中国社区创始人、开源布道师,还是Docker、Mesos、OpenStack、CF的中国社区组织者、技术专家。
陈冉还表示:极狐的目标是3到5年内在国内金融市场上市。
信息来源:量子位
05
这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺
近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」!
那么,狼为啥会选择直接撞死呢?
傻狼选择「自杀」,只因人间不值得!
近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。
在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。
然而大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!
偶尔一次能吃到,虽然正分,但是不值得。
狼是打工人,羊是永远达不到的升职加薪
这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。
网友们从狼抓羊的身上看到了自己。
那只狼不就是现在的我么!
狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…
还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」!
信息来源:新智元
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END