智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布

汇聚每周AI热点,不错过重要资讯!欢迎扫码,关注并订阅智源社区AI周刊。

d5864c9726c79e09f643690e577bc206.png

英伟达推出Magic3D,性能超过谷歌DreamFusion

近一段时间,让AI生成3D点云成为业界研究的重点。谷歌曾在9月提出DreamFusion,引起广泛关注。近日,英伟达提出了Magic3D,可以从文字描述中生成3D的AI模型。整个生成过程分为三个阶段,首先团队使用eDiff作为低分辨率图像先验,获得初始3D表示。之后通过反复的抽样和渲染,来训练和优化模型,并最终抽取出3D体素。之后,研究者采用扩散模型,对第一阶段获得的粗略模型进行抽样和渲染,优化为更高分辨率的图像。最终获得高分辨率的3D生成结果。

c70ddfe6b708ef8b253330a750c01a3b.png

Magic3D实现了根据输入的问题获得较高分辨率的3D图像。同时,用户还可以对提示文本进行修改,实现对于生成3D图像的编辑和修改。

Stable Diffusion 2.0支持超分辨率,结合景深信息:专业图像生成AI再进一步

近日,Stablity AI发布了Stable Diffusion的2.0版本。在这一版采用了研究组织LAION研发的OpenCLIP模型。此外,2.0版本中包括高级Diffusion模型,现在可以沈城2048x2048甚至更高像素的图像。另一方面,研究者提出了Depth-to-Image Diffusion模型,可以推断输入图像的景深,利用提示文本生成新图像。

8412d18e4a553a6da86232d26e66eb9f.png

自从Stable Diffusion开放以来,短短数月已经成为全球最为火爆的AIGC工具,但从玩具到生产力工具,模型本身的性能成为了新的瓶颈。本次Stable Diffusion2.0的更新更偏向于常规的功能改进,但其未来的目标是明确的:进军专业领域,让更多业内人士能够依赖它的力量。

谷歌Pitchfork实现自动编写代码和修bug功能,已投入使用

近日,谷歌实验室(Google X)曝光了一项新的孵化项目——Pitchfork。该系统可以自动编写代码,并修改代码中的bug。目前该系统已经在实验室内部投入使用,能够降低开发成本。

代码模型是继预训练语言模型后研究机构关注的另一个重点领域。由于代码相比自然语言具有更为严格的结构,需要生成的代码更为精细准确,因此对于中小机构而言难度较高。2021年,GitHub联合OpenAI利用大量的开源代码数据训练了Codex模型,并以此研发了Copilot代码补全插件,目前已有超过一百万的用户。

代码模型对于生产力的提升,降低研发成本具有显著作用。据统计,在目前十几种流行编程语言中,有40%是依赖Copilot生成的,而GitHub预计,五年内开发人员将使用Copilot编写超过80%的代码。代码模型在解决复杂编程问题上也具有潜力,DeepMind研发的AlphaCode模型在Codeforces编程竞赛平台上的排名位于前54.3%,即击败了超过40%的人类参赛者。

社区活动

  1. 报名 | 第一届机器学习算法于自然语言处理大会(MLNLP,11月26日)

  2. 报名 | DeepMind研究科学家,AlphaTensor论文一作亲讲:通过强化学习发现更快的矩阵乘法算法(智源社区,12月2日)

  3. 回放 | 北京交通大学教授魏云超:连续学习下像素理解的相关算法介绍


查看预训练、强化学习等领域周刊内容,欢迎点击阅读原文

招聘、活动、推广等合作,请联系:editor@baai.ac.cn

6116330acf658d784a8a05c5975af065.png

c6ae89fcb4397695dc3d02cf5ed78a94.png

5c5d974034567824acc54dd4f006596d.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值