OpenAI又火一个新项目,已开源...

大家好,我是 Jack。

OpenAI 又有新动作了,开源发布 Shap-E。

今天,我继续手把手教学。

算法原理、环境搭建、效果测试,一条龙服务,尽在下文!

一、Shap-E 效果

Shap-E 算法的功能,简单来讲就是根据一段文字描述,生成对应的 3D 模型,一起看几组效果。

输入文字:

A chair that looks like an avocado

(翻译:一把看起来像鳄梨的椅子。)

Shap-E 输出对应的 3D 模型:

输入文字:

A spaceship

(翻译:一艘太空船)

Shap-E 输出对应的 3D 模型:

输入文字:

An airplane that looks like a banana

(翻译:一架酷似香蕉的飞机)

更多生成效果:

目前 OpenAI 已经开源了 Shap-E 的代码。

二、算法原理

Shap-E 还是用到了潜空间扩散模型(Latent Diffusion)。

熟悉 Stable Diffusion 的小伙伴应该对于这个概念并不陌生,其实就是将一些高维信息,降维表示到一个特定的特征空间,然后再根据这些特征,做生成。

Shap-E 整体结构也是类似的 Encoder - Decoder 结构。

不过输入和输出变了,比如 Shap-E 的 Encoder 结构是这样的:

输入是点云模型,经过降维、交叉注意力层、Transformer等结构,最终获得一个 implicit MLP。

至于 Decoder 则采用 STF Rendering 进行渲染,同时加入了 CLIP 的 text embedding。

Shap-E 支持多模态,输入既可以是文字,也可以图片。

三、算法部署

项目地址:

https://github.com/openai/shap-e

算法部署并不复杂,Shap-E 只依赖于 CLIP。

可以单独创建一个名为 shape 的虚拟环境。

conda create -n shape python=3
conda activate shape

然后安装好 CLIP 的一些依赖。

conda install --yes -c pytorch pytorch=1.7.1 torchvision cudatoolkit=11.0
pip install ftfy regex tqdm

进入 Shap-E 项目的根目录,直接 pip 安装即可。

pip install -e .

pip 会根据 setup.py 进行安装。

我网速不太给力,本地搭建环境,大概花费了 1 个小时。

shap_e/examples/sample_text_to_3d.ipynb 是 text 生成 3D 模型的代码。

shap_e/examples/sample_image_to_3d.ipynb 是图片生成 3D 模型的代码。

在 A10 机器上,生成一次 3D 模型,大概需要花费 25 秒。

四、最后

当然,因为数据集等方面的原因,有些 3D 模型生成的效果还是挺差的。

比如我测试了A dog,得到了这么一个东西:

我输入A cat,得到了:

通过图片,生成 3D 模型,对于图片的要求很高,必须是白色背景的图片,效果才可以,或者干脆是透明背景。

在 Huggingface 也有人搭建了这个服务,非官方项目,但使用的是官方代码:

https://huggingface.co/spaces/hysts/Shap-E

我发出来之后,估计就有不少人排队了,可以错峰试玩。

测试了一番,我的感受是这样的:

如果你是这个方向的研究生,那这篇论文值得看,算法也值得跑一跑,一些思想可以参考,说不定下一篇 best paper 就是你的了。

但如果你是个吃瓜群众,那就别浪费时间跑了,效果还不到直接可用的程度,没有图片生成那种惊艳的效果,不能直接用来做一些素材的生产。

好了,今天就聊这么多吧,我是 Jack,我们下期见~

### 回答1: OpenAI是一家人工智能研究公司,该公司开发了许多重要的AI技术和应用,例如语言生成模型GPT-3和自然语言处理工具包OpenAI GPT-2。为了促进AI技术的发展,OpenAI决定将其部分研究成果开源,允许开发者下载和使用这些代码。 要从OpenAI官网下载其开源代码,需要访问其GitHub页面。开发者可以根据自己的需要浏览这些代码库,并选择合适的代码进行下载和使用。例如,如果你需要训练一个人工智能模型来处理自然语言,那么你可以下载OpenAI的GPT-2源代码,并根据文档进行配置和训练。此外,OpenAI还提供了API服务,可以让用户更轻松的调用其AI应用程序。 通过开源OpenAI鼓励人们共享和使用最人工智能技术,从而推动整个AI领域的发展。如果你对人工智能编程和研究感兴趣,访问OpenAI官网,下载并使用开源代码成为一个积极的方式。 ### 回答2: OpenAI人工智能领域的重要开发组织之一,其价值非凡。2015年,OpenAI由众多机器学习领域的专家创立,致力于开发一种全球范围内的人工智能平台,旨在让开发者能够轻松地使用最前沿的机器学习模型。OpenAI于2020年正式开源了其GPT-2和GPT-3模型的源代码。 想要下载OpenAI开源代码,首先需要了解OpenAI的GitHub页面,可以通过打开网站:https://github.com/openai,浏览OpenAI开源项目和文档,其中包括GPT-2和GPT-3模型的源代码、模型训练的数据集和模型预训练权重等。 下载方法如下: 1.打开开源项目的GitHub页面,找到所需的开源代码。 2.在项目页面中,找到“Code”按钮,点击该按钮,可以看到“Download ZIP”的选项,点击即可下载代码。 3.同时,GitHub还提供了Git命令行客户端的使用方法。用户可以使用Git命令行客户端下载代码,通过Git克隆项目的方式获取源代码。 总之,OpenAI开源的代码下载非常方便,只需要到其GitHub页面即可。由于OpenAI正在积极开发更加先进的机器学习模型,加入OpenAI开源社区,不仅可以充分利用OpenAI的模型,还有机会参与到全球范围内的人工智能研究和开发中。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jack-Cui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值