开源的MiniGPT-4可以让你提前体验一下GPT-4的魅力

最新推荐文章于 2024-04-13 17:52:20 发布

人工智能研究所

最新推荐文章于 2024-04-13 17:52:20 发布

阅读量202

点赞数

分类专栏：人工智能之NLP自然语言处理文章标签：开源人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44782294/article/details/130542714

版权

人工智能之NLP自然语言处理专栏收录该内容

36 篇文章 2 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

多模态GPT-4大模型的发布，让很多人看到了AI人工智能的魅力，特别是ChatGPT的流行，让很多人开始关注人工智能。虽然ChatGPT可以通过一些魔法进行使用，但是GPT-4多模态大模型，openai却没有完全免费开放给个人，要想使用GPT-4，要么通过官方的邀请，要么是升级到付费账号。但就算付费，一些地区也无法进行相关服务的购买。

GPT-4发布时，工程师一个手绘网页，传递给GPT-4时，模型会自动进行图片的识别，然后输出搭建整个网页的代码，强大的多模型模型吊足了大家的胃口。开源的MiniGPT-4多模态模型，让我们提前可以尝试一下GPT-4的魅力。

MiniGPT-4的架构由带有预训练 ViT模型编码器和Q-Former，一个单一的线性投影层，一个高级的 Vicuna 大语言模型

MiniGPT-4 旨在将来自预训练视觉编码器的视觉信息与先进的大语言模型（LLM）结合。具体来说，利用 Vicuna作为语言解码器，它是基于 LLaMA 构建，可以执行各种复杂的语言任务。对于视觉感知，使用与BLIP-2中相同的视觉编码器，一个ViT主干与他们预训练的

了解本专栏

超级会员免费看

人工智能研究所

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
开源的MiniGPT-4可以让你提前体验一下GPT-4的魅力

但就算付费，一些地区也无法进行相关服务的购买。GPT-4发布时，工程师一个手绘网页，传递给GPT-4时，模型会自动进行图片的识别，然后输出搭建整个网页的代码，强大的多模型模型吊足了大家的胃口。小编使用了同样的照片，同样的文字，来复现官方的HTML网页，模型生成的HTML网页只有js，没有css的部分，生成的网页有相关的文字，但是没有css的渲染，估计还需要各种调参。当然模型同样支持多轮对话讨论，虽然模型已经开源，但是运行此模型需要的电脑资源还是要求比较高的，怪不得ChatGPT类似的大模型，这么费经费。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

人工智能研究所 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。