大语言模型之五谷歌Gemini

shichaog

已于 2023-09-07 14:40:11 修改

阅读量2.1k

点赞数 1

分类专栏：神经网络&人工智能文章标签：语言模型人工智能自然语言处理

于 2023-08-26 16:45:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shichaog/article/details/132508362

版权

神经网络&人工智能专栏收录该内容

31 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

近十年来谷歌引领着人工智能方向的发展，从TensorFlow到TPU再到Transformer，都是谷歌在引领着，然而，在大语言模型上，却被ChatGPT（OpenAI）抢了风头，并且知道GPT-4（OpenAI）的推出，谷歌依然没有推出能打的竞品都没有，甚至是后来居上的LlaMA（Meta）类的Google也败下阵来，也许是Google倾尽资源在Gemini上了。
Gemini是谷歌大脑和DeepMind和ChatGPT竞争的多模态（ Visual-Language-Action (VLA) ）大语言模型，其是将CPT-4和AlphaGo类系统相结合的新的多模态大语言模型。
据传Gemini是将融合多模态Encoder-Decoder的新架构，Encdoer部分对不同的数据提出供Decoder理解的特征，Decoder的任务是理解和执行。

目前的大模型是不具备规划能力，需要用知识图谱等符号主义的方法来增强，也许 Google DeepMind 找到的方法是行为主义【强化学习】的方法，而非符号主义【知识图谱】的方法。
要在人工智能中真正实现 AGI ，这中间最关键的环节是让机器能够自主地从物理世界中学习，这就要求 AGI 具备连续的视觉理解能力。当前的ChatGPT离真正的AGI还欠缺以下能力：
1.感知世界的能力：这个基础是连续视觉

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shichaog 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。