谷歌发布第三代大型语言模型Gemini,性能全面超越GPT-4
2023年12月6日,谷歌正式发布了第三代大型语言模型Gemini。Gemini是谷歌基于Transformer架构构建的模型,在生成文本、翻译语言、编写不同类型的创意内容等方面都表现出卓越的性能。
在模型能力方面,Gemini在32个大型语言模型(LLM)研发中使用的广泛使用的学术基准测试中的30个中都超过了当前最先进的结果。在MMLU(大规模多任务语言理解)测试框架中,Gemini的得分高达90.0%,甚至超越了人类专家。
在多模态能力方面,Gemini是谷歌首款“原生多模态”模型,可以直接理解和处理多种不同类型的数据,而不需要额外的专门处理或转换。这使得Gemini在处理复杂的现实世界场景方面具有更大的优势。
在应用方面,Gemini提供了多种尺寸的模型,满足不同场景的需求。其中,Gemini Nano是谷歌迄今为止最小的大型语言模型,适用于内存受限的端侧设备。
Gemini的发布,标志着大型语言模型研究领域的又一次重大突破。Gemini的性能全面超越了GPT-4,在多模态能力方面更是独树一帜。Gemini的推出,将为人工智能在各个领域的应用带来新的机遇。
话不多说,我们看看发布的视频
整个视频看起来还是相当炸裂的,多模态能力令人印象深刻,甚至能和你玩各种小游戏,期待早日开测吧