以视觉为中心的多模态大型语言模型 Cambrian-1 在线运行教程

小白狮ww

已于 2024-08-05 07:34:23 修改

阅读量446

点赞数 3

文章标签：人工智能深度学习图像处理机器学习语言模型数据库自然语言处理

于 2024-07-26 10:38:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XLionXxxx/article/details/140708916

版权

Cambrian-1 是由谢赛宁和 Yann LeCun 团队研发的一系列以视觉为中心的多模态大型语言模型（MLLMs），旨在通过大型语言模型和视觉指令调整来评估不同的视觉表示，提供对模型和架构的新见解。

使用云平台：OpenBayes

openbayes.com/console/signup?r=sony_0m6v

登录到 OpenBayes 平台后，打开「公共教程」，找到「在线运行寒武纪1号Cambrian-1 Demo」的教程。

进入到教程界面后，点击右上角「克隆」。

平台在克隆过程中以自动为我们配置好了模型文件，点击「下一步：选择算力」。

模型较大，需要使用 A6000 运行，选择 A6000 算力和 PyTorch 镜像后，点击「下一步：审核」。

确认模型信息无误后，点击「继续执行」。

稍等片刻，待系统分配好资源，状态栏显示为「运行中」后，打开工作空间

打开终端，输入 bash setup.sh。

系统输出 Environment variable added to .bashrc 后，输入指令 source ~/.bashrc

完成初始化后，在终端中输入命令 bash control.sh，运行代码后，模型将会启动一个控制器。

稍等 15s 左右，打开一个新的终端，输入命令 bash gradio.sh，模型将会输出一个 Running on public URL 的链接，我们点击进入。

返回工作空间，再打开一个新的终端，输入命令 bash model.sh ，当系统输出 Uvicorn running on 一个链接时表示模型已配置完成，然后我们返回到之前的模型 Demo 界面，点击刷新，可以看到可以选择模型了。

我们选择示例来测试模型，上传一张炸鸡的照片，并询问 what does this image remind you of（这张图片让你想起了什么），可以看到模型的回答了The image of fried chicken pieces arranged to resemble a map of Africa is a creative and humorous take on food presentation. It's a playful way to engage viewers and make the meal more memorable.（炸鸡块排列成非洲地图的形象是对食物展示的创造性和幽默的呈现。这是一种有趣的方式来吸引观众，让这顿饭更难忘。）是非常准确的。

换一道数学题，可以看到模型输入了答案A，也是十分正确的。

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
以视觉为中心的多模态大型语言模型 Cambrian-1 在线运行教程

返回工作空间，再打开一个新的终端，输入命令 bash model.sh ，当系统输出 Uvicorn running on 一个链接时表示模型已配置完成，然后我们返回到之前的模型 Demo 界面，点击刷新，可以看到可以选择模型了。稍等 15s 左右，打开一个新的终端，输入命令 bash gradio.sh，模型将会输出一个 Running on public URL 的链接，我们点击进入。模型较大，需要使用 A6000 运行，选择 A6000 算力和 PyTorch 镜像后，点击「下一步：审核」。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。