每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
法国人工智能初创公司Mistral AI近日发布了Pixtral 12B,这是一款能够处理图像和文本的先进模型。随着该模型的推出,Mistral AI正式加入了日益增长的多模态AI系统行列,其他知名的多模态AI系统还包括Anthropic的Claude、OpenAI的GPT-4o和谷歌的Gemini。
顾名思义,Pixtral 12B拥有120亿个参数,并配备了一个4亿参数的视觉适配器,使其不仅能处理文本输入,还能够“读取”图像。这个新模型是在Mistral之前推出的仅能处理文本的Nemo 12B模型基础上进行升级的。新功能允许用户通过URL或base64编码上传图像,其中后者将图像转换为类似JSON文件的字符串,AI模型能够解码这些字符串并将其还原为图像。Pixtral 12B可以处理多种任务,如为图片生成标题、统计图片中的物体数量,以及回答有关图像内容的常见问题。
Apache 2.0许可下发布
Mistral的开发者关系负责人Sophia Yang透露,该模型将很快在Le Chat和Le Platforme上线,这意味着任何拥有用户账号的人都可以免费试用该聊天机器人或API功能。Mistral AI已经在GitHub和Hugging Face上发布了Pixtral 12B的代码和参数,鼓励开发者下载、优化并进一步训练该模型。
Pixtral 12B模型大小为24 GB,开源且在宽松的Apache 2.0许可下免费提供。这与Mistral其他一些模型,如Mistral 7B、Mixtral 8x22B、Mistral Nemo和Mistral Embed,所使用的许可一致。而该公司推出的其他模型如Mistral Large则受到研究许可或非生产许可的限制,禁止商业用途,仅限于科研。
对训练数据来源的担忧
大语言模型(LLM),尤其是多模态模型,通常从互联网或社交媒体获取训练数据,其中很多信息涉及版权问题。有些内容是未经上传者许可的情况下被用于训练AI模型的。Mistral AI的美国竞争对手OpenAI曾广泛利用Reddit等论坛训练自己的模型,起初并未支付任何费用,之后才与这些平台达成协议。此举一度引发用户的抵制,但最终并未产生实质影响。
一年内估值近60亿欧元
法国初创公司Mistral AI在最近的融资轮中达成了目标,筹集了6亿欧元。公司目前的估值接近60亿欧元——对于一家成立仅一年的公司来说,这无疑是一个惊人的数字。
根据《金融时报》的报道,最新融资中包含了4.68亿欧元的股权融资和1.32亿欧元的债务融资,使该公司的总估值达到5.8亿欧元。