这 2 个开源项目,牛逼炸裂!!

8f2bff5c2209c905b6e66d0bc45dcd7b.png


01

Meta 重磅开源:抠出视频中的主体

Meta 公司推出的 Segment Anything Model 2 模型开源!

相比于之前 Meta 之前发布的 SAM,SAM2 可以看做是从图像到视频领域的推广。

SAM2 能够实时分割静态图像和动态视频内容中的任何对象,即使模型之前未曾见过这些对象。为未来的各种应用场景,如混合现实、自动驾驶车辆、视频编辑等提供了强大的技术支持。

SAM 2的架构采用了创新的流式内存设计,使得它非常适合实时应用,并且能够在图像分割准确率和视频分割性能上超越现有技术。可以看下面这些演示:

使用 SAM2 能够将视频中的物体抠出来,并且跟踪这个物体应用创意效果。

应用各种创意的场景,比如跟踪球球,分割显微镜视频中移动的细胞:

支持选择任何视频帧中的对象

及时视频中的小孩暂时被树遮挡,也能成功的扣除主体:

即使视频中有很多相似的马,SAM2 也能一直跟踪选中的那匹,并且抠出来:

及时自行车在高速移动,也能把细节抠的明明白白:

Meta还发布了一个大型带标注的数据集 SA-V,为 SAM 2 提供了丰富的训练数据。

总的来说,SAM 2 的发布是 Meta 在 AI 领域的一个重要里程碑,它将为计算机视觉任务带来革命性的变化,并推动相关技术的发展和应用。

02

文生图开源新霸主!

FLUX 一个由 Black Forest Labs 精心打造的开源项目,Black Forest Labs 由 Stable Difusion 原班人马和多位 Stability Al 前研究员成立,致力于研发多模态模型并开源。

85c9e2593174b4bdd7360473de3c0f86.jpeg

FLUX.1 项目包含三个版本:Pro 版、开发者版本、极速版。

开源地址:https://github.com/black-forest-labs/flux

FLUX.1 一经推出,便获得了3200 万美元种子轮融资。正如其名,FLUX 代表着流动性和变革,它通过先进的文本到图像和图像到图像的转换技术,为艺术家和创作者提供了无限的想象空间。

这款新模型声称超越 Midjourney V、DALLE3 等闭源模型,还大幅领先于开源的 SD3 系列。而且提高了生成人手和手指的准确性。


扫描二维码 关注逛逛 GitHub

8a35ab0357b0dc365afc53f5ea1eaea7.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值