Sarrey-CSDN博客

原创 NExT-GPT：Any-to-Any 多模态大模型

一个端到端的通用的任何到任何MM-LLM系统

2024-08-08 18:20:17 1278

原创 Multiview Detection 多视图检测：MVDet & MVDeTr

多视图多目标检测方向，MVDet和MVDeTr系列论文解读

2024-08-02 18:09:17 2741 1

原创多相机多目标跟踪综述

多摄像机多目标跟踪（MCMOT）涉及跟踪不同摄像机视图中的多个对象，即使对象在摄像机之间移动，也能确保连续性和身份一致性

2024-08-02 11:41:33 1501

原创 A Survey on Generative Diffusion Models（生成扩散模型综述）

作者在本文中总结了扩散模型中基本算法的数学表达和推导过程，并对改进的扩散算法进行了全面的分类。同时，作者提供了扩散模型在计算机视觉、自然语言处理、生物信息学、语音处理中应用的广泛陈述，提出目前模型的局限性和扩散模型可能的进一步证明方向。作者把现今扩散模型的改进分成四个主要类别：1）抽样加速2）扩散过程设计 / 结构多样化3）似然优化4）降低维度论文作者在github上整理了生成扩散模型领域近年各大改进方法，以及在计算机视觉、序列建模、音频、科学领域应用的相关论文和代码。

2024-03-09 11:15:09 1939