AIGC开发者的效率利器:OneDiff让图片/视频生成加速3倍

姚迟在活动中介绍了OneDiff的高性能,其企业版图像生成速度比基准引擎快3倍。OneDiff注重性能和灵活性,兼容多种引擎,实现PyTorch混合运行,并通过优化解决预热和部署难题。最新版本提供免费社区版,支持SD与SVD加速。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

OpenAI的视频生成模型Sora爆火一个多月,有关Diffusion Model的解析和探讨还在持续。

近日,在硅基流动、EPIC、Datawhale主办的《多模态时代已至,Diffusion Model怎么玩儿?》活动中,硅基流动的OneDiff作者之一姚迟对图片/视频生成推理加速进行了全面介绍。

自开源Stable Diffusion模型发布以来,OneDiff就以其卓越的性能长期保持领先。目前,OneDiff企业版的图像生成速度最高可达基准引擎的3倍,之所以能够达到这样的速度,是因为硅基流动在CUDA优化、动静图转换、编译优化和算子融合等技术积累。

对用户而言,使用同样的GPU,原本需要24小时不间断工作才能完成的生成式任务,使用OneDiff可以8小时内就可以搞定。

ecc03397df162d29a8872e8bac57eb41.png

(SDXL E2E Time)

4f06c6f7413c9438d56cbf97d8660bff.png

(SVD E2E Time)

OneDiff不仅注重性能,还兼顾灵活性。它向下对接各种深度学习引擎,向上对接Diffusers,ComfyUI和SD-WebUI前端应用框架,满足各类用户的需求。在底层架构上,OneDiff实现了与PyTorch的混合运行,是市面上唯一实现了这种混合运行技术的产品。通过自研的虚拟机和编译技术,OneDiff将加速收益高的部分交给资源虚拟机处理,而对于那些加速效益不高的部分,为了保持灵活性可继续使用PyTorch。

03d4e1fcb6f879dc06d8606c8674b60f.png

值得一提的是,为解决预热时间长和部署成本高的难题,硅基流动团队借助自研的虚拟机对编译进行了系列优化,将预热做得足够小,同时避免了设备转换间的重复编译问题。

1cb050d173c8999686f454976e2facf5.png

519496556d37da0a2f92a0904ca6f50e.png

在图像输出效果上,OneDiff几乎实现了无损加速。

c4049d1bef64fc6b36daa661d3b5241e.png

目前,OneDiff在GitHub上开放了免费的社区版本,并且刚刚发布了OneDiff v0.12.1 ,能帮助用户在生产环境稳定加速SD与SVD,新版本特性包括SDXL和SVD的SOTA性能更新、全面支持SD和SVD动态分辨率运行、编译/保存/加载HF Diffusers的pipeline、HF Diffusers的快速LoRA加载和切换、加速了 InstantID(加速1.8倍)、加速了 SDXL Lightning。

无论是算法研究还是工业部署,用户都可以轻松上手OneDiff。欢迎体验OneDiff社区版:github.com/siliconflow/onediff

其他人都在看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值