让我们来看一下8月份有哪些大模型更新,涵盖了多个领域,包括语言模型、视觉模型以及数学模型等。以下是本次更新的主要亮点:
- 1、 智谱系列升级:
a、GLM-4-Flash:免费供应,提供快速响应的对话体验。
b、GLM-4-Long:超长上下文模型,支持高达1百万tokens的上下文,成本为1元/百万tokens。
c、GLM-4-Plus:旗舰版模型,性能升级,成本降至50元/百万tokens。
d、GLM-4V-Plus:升级版视觉多模态模型,上下文扩展至8K,成本降至10元/百万tokens。
e、Cogview3-Plus:文生图模型升级,成本降低40%,支持更多种分辨率,生成一张图的成本为6分。
点评:智谱全系都做了功能升级以及成本降低。其中GLM4V-PLUS,本身拥有不俗的性能,成本大幅下降,同时上下文达到了8K,实用性大幅增强,目前识别一张手机图片的成本大约1分钱,非常实用。并且智谱还拥有视频生成模型,可能是国内最全面的大模型公司。
2、通义千问系列升级:
- Qwen2-Math:专门为数学场景优化的模型,数学能力超越多个顶流模型,如GPT4o,Claude3.5 Sonnet, DeepSeek Coder。目前免费供应。
- Qwen2-VL:最新的视觉大模型,支持视频识别,性能指标对标GPT4o和Claude3.5 Sonnet,具有32K的上下文处理能力,成本为20元/百万tokens。
点评:Qwen2-Math登顶当前最强数学模型,面对数学问题时是一个可选模型。Qwen2-VL测试指标相当高,32K的上下文使得泛用性更强,输入成本比GPT4o略高,但输出成本低3倍,是一个国产替代的选择。
3、DeepSeek系列升级:
发布最新的缓存命中技术,有效降低成本至0.1元/百万tokens,适用于文件读取和固定提示词。
点评:由于token消耗大部分是在系统提示词中,妥善使用确实可以极大降低成本,同时还能保证较高的输出质量。
4、MiniMax系列升级:
- abab6.5s:成本降至1元/百万tokens,具有254K的上下文处理能力,以及极高的token处理速度。
5、腾讯混元系列升级:
发布多模态模型hunyuan-vision,具有4K的上下文,成本为18元/百万tokens。
6、Openai系列升级:
- gpt-4o-2024-08-06:综合成本降低40%,输入成本为18元/百万tokens,输出成本为72元/百万tokens,最大输出tokens升级至16K。支持结构型输出(Structured Output)
点评:GPT4o降价后,价格竞争力又上来了,甚至比不少国产模型都便宜。与此同时,升级了16K的输出上限,并且支持结构型输出,性能也在同步升级。
7、Gemini系列升级:
- gemini-flash:输入成本0.5元/百万tokens,输出成本2元/百万tokens。
- gemini-pro:输入成本25元/百万tokens,输出成本76元/百万tokens。
点评:谷歌的Gemini本身就是实力强劲的多模态模型,成本大幅优化后,保持了其综合竞争力。
用户可以在智匠AI(MindCraft AI)上体验最新更新的模型。