Diffusion Model
文章平均质量分 94
黑洞是不黑
神学研究者
展开
-
SYNERGIES BETWEEN DISENTANGLEMENT AND SPARSITY: A MULTI-TASK LEARNING PERSPECTIVE
虽然人们常说解偶表示 (disentangled representations) 对于下游任务有益,但目前对其的经验和理论理解有限。在这项工作中,我们提供了证据表明,结合稀疏基预测器的解偶表示改善了泛化性能。在多任务学习的背景下,我们证明了一个新的可辨识的 (identifiability) 结果,它提供了最大稀疏基预测器产生解偶表示的条件。在这一理论结果的启发下,我们提出了一种基于稀疏促进的双层优化问题的实际学习解偶表示的方法。最后,我们探索了基于群lasso多类SVM基预测器的这种算法的元学习版本,并原创 2024-01-25 19:57:06 · 1068 阅读 · 0 评论 -
DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior
我们提出了DiffBIR,它利用预训练的文本到图像扩散模型来解决盲图像恢复问题。我们的框架采用两阶段pipeline。在第一阶段,我们在多种退化中预训练恢复模块,以提高现实场景中的泛化能力。第二阶段利用潜在扩散模型的生成能力,实现真实的图像恢复。具体来说,我们引入了一个injective modulation 子网络——LAControlNet进行微调,而预训练的Stable Diffusion是为了保持其生成能力。原创 2024-01-25 19:56:30 · 1597 阅读 · 0 评论 -
DIFFUSION POSTERIOR SAMPLING FOR GENERAL NOISY INVERSE PROBLEMS
在最近的研究中,扩散模型被作为强大的生成逆问题求解器,因其高质量的重建和结合现有迭代求解器的便利性。然而,大多数研究侧重于在无噪声设置中解决简单的线性逆问题,这在很大程度上低估了真实世界问题的复杂性。在这项工作中,我们通过后验采样的逼近,将扩散求解器有效地扩展到处理一般的带噪声(非)线性逆问题。有趣的是,所得到的后验采样方案是扩散采样与流形约束梯度的混合版本,而无需严格的测量一致性投影步骤,在噪声环境中相比先前的研究具有更理想的生成路径。原创 2023-11-29 19:56:07 · 1451 阅读 · 0 评论 -
VQGAN理论加代码一对一详解,小白向解析
VQGAN原理代码解读原创 2023-09-17 17:19:20 · 5428 阅读 · 3 评论