多模态与即将上线的GPT-4

最新推荐文章于 2024-07-17 21:40:42 发布

Fonix大笨钟

最新推荐文章于 2024-07-17 21:40:42 发布

阅读量185

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AFonix/article/details/129458214

版权

多模态（multimodal) 指的是多种模态的信息，包括文本，图片，语音，视频等。

这个概念本身很容易理解，而在计算机中多模态还分为输入和输出两个方面。

对于近来大火的Chatgpt来说，输入和输出都只有文字，也就是单模态。

而微软德国CTO Braun 在一次会议中宣布接下来即将发布的GPT-4将拥有多模态模型。

但是目前不确定这个多模态指的是在输入上还是输出上，以及将会包括哪种模态。

有技术人员分析，输出上的多模态将需要大量的算力和发展，目前可能不太现实。所以更大概率是在输入上允许多模态，即允许用户上传图片或视频等作为GPT-4的输入，然后以文本的形式给出答案输出。

即使是这样也无疑是非常大的一个技术飞跃，而这项技术也将运用各个领域。例如管理人员只需要给出一张业绩表现图，而AI就能自动生成一份详细的报告。将组织架构图发给AI，让它进行优化等等。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
多模态与即将上线的GPT-4

多模态与GPT-4
复制链接

扫一扫

博客等级

码龄10年

2
原创

0
点赞

3
收藏

1
粉丝

关注

私信

热门文章

分类专栏

数据挖掘与知识图谱 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

【理论】数据预处理流程

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Fonix大笨钟 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。