每周AI行业资讯-Google、Meta、Flux、360等公司的最新资讯

存储灾备AI

于 2024-08-07 09:10:43 发布

阅读量423

点赞数 3

文章标签：人工智能

本文链接：https://blog.csdn.net/diveintokernel/article/details/140973302

版权

国外厂商

上周，Google在AI领域大展拳脚，先后发布了Gemini 1.5 Pro和Gemma 2 2B两个新模型。

排名第一：在LLM竞技场的综合排名中，Gemini 1.5 Pro 0801超过了GPT-4o mini，跃居第一。
实验版本：虽然Google称其为实验版本，还未正式发布，但已在AI Studio中提供使用。
多模态能力：该模型在多模态能力上表现出色，超越了GPT-4o和Claude 3.5，并支持音频和视频处理。例如，我用一个多小时的播客文件进行测试，模型在十几秒内就完成了总结。

在SD3模型出现问题后，开源图像领域一度陷入低迷，创新和新玩法越来越少。社区急需一个强大的图像模型来推动发展。

前Stability AI核心成员Robin Rombach创立了一家新公司，并获得了3200万美元的融资。他们发布了一系列图像生成模型，其中两个是开源的。这些模型的质量接近Midjourney，成为开源图像生成领域的新标杆。

FLUX.1 [pro]
- 特点：FLUX.1的最佳版，提供最先进的图像生成性能。
- 优势：拥有一流的提示跟随、视觉品质、图像细节和输出多样性。
FLUX.1 [dev]
- 用途：用于非商业应用的开放权重导向精馏模型。
- 来源：直接从FLUX.1 [pro]精馏而来。
- 特点：具有类似的质量和提示词依从能力，同时比相同尺寸的标准模型更高效，可用于非商业用途。
FLUX.1 [schnell]
- 特点：最快型号，专为本地开发和个人使用而设计。
- 许可：在Apache 2.0许可下公开可用。
- 支持：已经获得ComfyUI的支持，可以直接使用。

上周，Meta在图像领域继续发力，发布了Meta Segment Anything Model 2（SAM 2）图像分割模型。

同时发布的还有SA-V，这是目前最大的视频分割数据集，具有以下主要特点：

在演示中，SAM 2能够从一个非常模糊且画面复杂的航拍视频中稳定跟踪和分割指定人物，展示了其强大的分割能力。

在对所有模型进行详细测试明确了模型能力之后在利用 360 自研的搜索意图判断能力和 AI 模型路由，在用户问问题的时候用对应领域最好的模型回答。这个综合模型的效果甚至全面超过了 GPT-4o。

关注