作者:一号
编辑:美美
OpenAI的大金主微软,还想缔造“下一个OpenAI”。
周一晚间,成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同,Mistral AI本次发布的版本性能更强,体量也更大,直接对标OpenAI的GPT-4。
在目前所有能够通过API访问的大模型中,Mistral Large排名第二,仅次于“当红明星”GPT-4,并且和GPT-4一样,是唯二在MMLU考试中拿到了80分以上的。
而且随着Mistral Large上线,Mistral AI还推出了名为Le Chat的聊天机器人,对标ChatGPT,大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持,Le Chat的服务器还是被挤爆了。
忘了初心,开源变闭源?
早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因为其强大的性能,还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型,而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世,自然引人注目。
从性能上来说,尽管Mistral Large在参数量上还比不上GPT-4,但在一些关键性能上,它还是能够和GPT-4一战的,可以说,已经是当前业内前三的地位。
在推理准确性上,Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型,并且它还支持32k token的上下文窗口,支持精确指令,自带函数调用能力。在推理速度上,Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。
但有眼尖的网友发现,Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这让不少开源大模型爱好者开始担心,Mistral AI也会像OpenAI一样,从开放走向封闭。
不过据媒体对Mistral CEO的采访,未来他们依旧会坚持开源理念,但与此同时,也会推出性能最为强大的闭源模型来参与商业竞争。
从诞生之初,就充满传奇光环
谁能想到,今天这个逼近GPT-4的模型,是来自一家仅仅成立9个月的法国公司。
Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间,他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过,其中Lample还领导了LLaMA模型的开发。在那时,全球范围内具备构建、训练和优化大型语言模型(LLM)专业经验的人才不超过100人。
Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌,成为了DeepMind的研究员,专注于提高AI和机器学习系统的效率。在那里,他参与开发了大型语言模型,并以主要作者的身份发表了著名的“Chinchilla论文”,该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。
然而随着AI竞赛的升温,Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队,但他觉得在大型科技公司中开发不透明的技术过于官僚化,于是决定离开。
2023年初,他离开了谷歌,和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型,并坚持开源模型的原则,希望让每个人对自己使用的AI有更多的控制权。
在种子轮融资时,Mistral AI的故事更具传奇色彩:一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元,涨了七倍多。尽管与美国的竞争者相比,所获得的资金并不算多,但他们的目标是成为AI领域中最节省资本的公司。
微软想要打造下一个OpenAI?
在Mistral Large以令人惊喜的性能收获目光之时,微软CEO纳德拉宣布,微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后,又再一次地把“真金白银”投给了AI圈的另一家顶流模型公司。
人们不禁怀疑,微软这是想要打造“下一个OpenAI”?
根据公告,微软和Mistral AI的合作将集中在以下三个关键领域:
超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。
扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。
人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。
毫无疑问,除了OpenAI之外,微软还想给自己的Azure云服务吸引更多客户。并且,微软两头下注,实际上很可能是想要分散风险,并且期望获得更大的影响力。
去年11月,OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东,微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位,这让他们对OpenAI的内部运作有了更多的了解,但在一些重大决策上,微软依旧没有投票权。
微软作为OpenAI的最大金主,显然没在OpenAI的决策上取得与之相对应的影响力。因此,微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。
这一点,在路透社对Mistral AI的采访中也得到了体现,Mistral AI承认,作为交易的一部分,微软将持有该公司少数股权,但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资,在是否持有该公司股权的问题上,微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。
另外,由于Mistral AI是一家法国公司,在语言支持上也更加偏向于欧洲本土语言,因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力,在欧洲AI领域站稳脚跟。
与美国不同,欧洲许多国家对AI的态度偏保守,持批判性看法,尤其是数据保护方面。因此投资一家欧洲本土的AI企业,打造一家“欧洲版OpenAI”,也许能够更让人放心。