这 2 个开源项目，牛逼炸裂！！

最新推荐文章于 2024-10-12 08:40:19 发布

逛逛GitHub

最新推荐文章于 2024-10-12 08:40:19 发布

阅读量1.2k

点赞数 5

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47080540/article/details/140998016

版权

01

Meta 重磅开源：抠出视频中的主体

Meta 公司推出的 Segment Anything Model 2 模型开源！

相比于之前 Meta 之前发布的 SAM，SAM2 可以看做是从图像到视频领域的推广。

SAM2 能够实时分割静态图像和动态视频内容中的任何对象，即使模型之前未曾见过这些对象。为未来的各种应用场景，如混合现实、自动驾驶车辆、视频编辑等提供了强大的技术支持。

SAM 2的架构采用了创新的流式内存设计，使得它非常适合实时应用，并且能够在图像分割准确率和视频分割性能上超越现有技术。可以看下面这些演示：

使用 SAM2 能够将视频中的物体抠出来，并且跟踪这个物体应用创意效果。

应用各种创意的场景，比如跟踪球球，分割显微镜视频中移动的细胞：

支持选择任何视频帧中的对象

及时视频中的小孩暂时被树遮挡，也能成功的扣除主体：

即使视频中有很多相似的马，SAM2 也能一直跟踪选中的那匹，并且抠出来：

及时自行车在高速移动，也能把细节抠的明明白白：

Meta还发布了一个大型带标注的数据集 SA-V，为 SAM 2 提供了丰富的训练数据。

总的来说，SAM 2 的发布是 Meta 在 AI 领域的一个重要里程碑，它将为计算机视觉任务带来革命性的变化，并推动相关技术的发展和应用。

02

文生图开源新霸主！

FLUX 一个由 Black Forest Labs 精心打造的开源项目，Black Forest Labs 由 Stable Difusion 原班人马和多位 Stability Al 前研究员成立，致力于研发多模态模型并开源。

FLUX.1 项目包含三个版本：Pro 版、开发者版本、极速版。

开源地址：https://github.com/black-forest-labs/flux

FLUX.1 一经推出，便获得了3200 万美元种子轮融资。正如其名，FLUX 代表着流动性和变革，它通过先进的文本到图像和图像到图像的转换技术，为艺术家和创作者提供了无限的想象空间。

这款新模型声称超越 Midjourney V、DALLE3 等闭源模型，还大幅领先于开源的 SD3 系列。而且提高了生成人手和手指的准确性。

扫描二维码关注逛逛 GitHub

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。