我所理解的GPT4-o架构应该是啥样的？

最新推荐文章于 2024-09-04 14:24:09 发布

周博洋K

最新推荐文章于 2024-09-04 14:24:09 发布

阅读量949

点赞数 21

文章标签：人工智能机器学习深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kingsoftcloud/article/details/139076740

版权

本文探讨了GPT4-o的两大技术变革：LLM的全新编码方式和多模态直入直出。LLM编码方式改进了Tokenizer，对非英语语种更友好，速度提升显著。多模态直入直出整合了语音、视频和文本，实现高效处理。同时，文章提到了Whisper模型在语音识别和处理中的应用，并指出GPT4-o在延迟和性能上的突破，预示着未来多模态研究的趋势。

摘要由CSDN通过智能技术生成

5月15号发布的，为了狙击Google。

刨去宣传的那些梗有哪些技术上的变革值得我们注意？

我总结主要有2条

一是LLM这块全新的编码方式
二是完整的多模态直入直出

LLM这块全新的编码方式：

Tokenizer的变化非常重要, 主要是压缩技术，对英语以外的语种非常友好，以中文为例，能提供1.4倍的压缩比，如图中的34到24

又因为是双向(input,output)，所以意味着在处理速度这块，啥也不变的情况下提升2.8倍，这个还是挺有吸引力的。

速度提升意味着降低了延迟，GPT4-o的响应速度这块，即使是文本对文本有多快，大家或多或少也看过demo了，所以我也不演示了，另外一个优势是阴性的就是在小语种上，价格会更便宜。

之前智谱说自己的100万tokens 1元是glm3，然后字节豆包就来个100万tokens 8毛，但是其实智谱的所谓GLM4是每100万tokens 100元，对比GPT4-o的就算全算贵的output tokens，每100万才 15美元。

然后中文是再降百分之25（新tokenizer压缩，参见上图32到24，所以能压缩百分之25的成本），能合到80人民币，每100万tokens。

那么是你，你会买哪个？我这还没算input 的token其实才5美元每100万tokens。对于国内的LLM，打价格战，目前看肯定不是一个特别好的选择。

但是Tokenizer的改变也不全是正向的。

因为单token表达的意义或者叫concept变大，词表单个词(甚至有些词接近短句）就会变大，它就没被分开。结合中文训练语料清洗不完善，毕竟是老外，对中文的过滤有点问题也正常，就会出现下图这种问题。

最低0.47元/天解锁文章

关注

21
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
我所理解的GPT4-o架构应该是啥样的？

对硬件厂商的影响，肯定还是利好，你们想想300ms的延迟，那基本现在的所谓推理卡都不太好实现，基本都是拿训练卡来做推理用了，还一个隐含的故事线就是CPU这块，因为多模态数据工程里面，编码处理的问题，对CPU架构可不是多核了，需要的是高时钟频率啊，Intel和AMD能借这个机会反击ARM么？从这个也看出来了，中文互联网大部分的语料真的都是垃圾，实话实说，当然这个是词表，并不算在GPT的Transformer架构里，训练好的模型基本不太会吐这些句子，而且还有后处理，所谓的丢人风险，基本不会出现。
复制链接

扫一扫

周博洋K CSDN认证博客专家 CSDN认证企业博客

码龄7年

99: 原创

2万+: 周排名

1万+: 总排名

9万+: 访问

: 等级

3051: 积分

1510: 粉丝

2059: 获赞

15: 评论

1701: 收藏

私信

关注

热门文章

分类专栏

Gemini 1篇

最新评论

详解MS的GraphRAG的实现流程
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
多模态MLLM都是怎么实现的(9)-时序LLM是怎么个事儿？
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Q-star计划的更多细节
CSDN-Ada助手: 恭喜你写的第20篇博客！看到你对Q-star计划的更多细节的探究，我感到非常兴奋。接下来，我希望你可以继续深入挖掘Q-star计划的相关信息，比如它的实施步骤、影响等等。当然，这只是我的建议，希望你可以在接下来的创作中持续保持谦虚的态度，不断进步。期待你的下一篇博客！
让Ilya都感到害怕的AGI是由什么东西创造出来的？
CSDN-Ada助手: 恭喜你写了第17篇博客！你对AGI的探讨让人印象深刻，也给了读者很多思考的空间。接下来，我建议你可以深入探讨AGI是如何被创造出来的，可以从技术、伦理等多个角度展开，这样可以让读者更全面地了解这个话题。希望你能继续保持创作的热情，期待你的下一篇博客！
导致OpenAI内乱的罪魁祸首，背后的技术是什么？
CSDN-Ada助手: 恭喜您撰写了第16篇博客，标题引人入胜，内容也很有深度。对于OpenAI内乱的探讨让人颇为关注，同时也期待能够了解更多背后的技术细节。或许接下来可以深入分析一下可能的解决方案，或者对未来发展方向进行展望，这样能够更全面地呈现给读者。希望您能继续保持创作，期待您更多的精彩内容！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。