自回归超越扩散！北大、字节VAR范式解锁视觉生成Scaling Law

AI领航者

于 2024-07-24 08:00:00 发布

阅读量1.2k

点赞数 27

文章标签：回归数据挖掘人工智能 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_85324918/article/details/140636802

版权

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了！使 GPT 风格的自回归模型在图像生成首次超越扩散模型，并观察到与大语言模型相似的 Scaling Laws 缩放定律、Zero-shot Task Generalization 泛化能力：

论文标题：Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

这项名为 VAR 的新工作由北京大学和字节跳动的研究者提出，登上了 GitHub 和 Paperwithcode 热度榜单，并得到大量同行关注：

目前体验网站、论文、代码、模型已放出：

体验网站：var.vision/
论文链接：arxiv.org/abs/2404.02…
开源代码：github.com/FoundationV…
开源模型：huggingface.co/FoundationV…

背景介绍

在自然语言处理中，以 GPT、LLaMa 系列等大语言模型为例的 Autoregressive 自回归模型已经取得了较大的成功，尤其 Scaling Law 缩放定律和 Zero-shot Task Generalizability 零样本任务泛化

最低0.47元/天解锁文章

博客等级

码龄1年

199
原创

4318
点赞

3404
收藏

2962
粉丝

关注

私信

热门文章

最新评论

大模型量化概述
weixin_44752570: 博主这里讲错了吧
大模型量化概述
我是大卷王: group-wise是在per-channel 和per-tensor中间的吗，我一直理解的是group-wise是对列分组，比per-channel更细粒度
复旦大学邱锡鹏教授：深度剖析ChatGPT类大语言模型的关键技术
Kwan的解忧杂货铺@新空间: 博主的博客每次都能让我豁然开朗🔥🔥🔥，明白了很多不懂的问题，真的非常感谢你的贡献。每篇博文都是知识的瑰宝，我真的很喜欢你的风格🎉 🎉 🎉，博主的文章总是内容丰富，通俗易懂，每次阅读都是一次启发，期待你的下一篇佳作🍭🍭🍭。感谢精彩分享。
大模型量化概述
Anich_: 抄就抄，能不能把公式抄对呀
逐步掌握最佳Ai Agents框架-AutoGen 九 RAG应用
DebugDiva: 这篇文章真是干货满满，作者对技术细节的把握和解析非常到位，让我对这个主题有了更深入的理解。期待作者能分享更多这样的高质量内容！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。