自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 NExT-GPT:Any-to-Any 多模态大模型

一个端到端的通用的任何到任何MM-LLM系统

2024-08-08 18:20:17 1278

原创 Multiview Detection 多视图检测:MVDet & MVDeTr

多视图多目标检测方向,MVDet和MVDeTr系列论文解读

2024-08-02 18:09:17 2741 1

原创 多相机多目标跟踪综述

多摄像机多目标跟踪(MCMOT)涉及跟踪不同摄像机视图中的多个对象,即使对象在摄像机之间移动,也能确保连续性和身份一致性

2024-08-02 11:41:33 1501

原创 A Survey on Generative Diffusion Models(生成扩散模型综述)

作者在本文中总结了扩散模型中基本算法的数学表达和推导过程,并对改进的扩散算法进行了全面的分类。同时,作者提供了扩散模型在计算机视觉、自然语言处理、生物信息学、语音处理中应用的广泛陈述,提出目前模型的局限性和扩散模型可能的进一步证明方向。作者把现今扩散模型的改进分成四个主要类别:1)抽样加速2) 扩散过程设计 / 结构多样化3)似然优化4)降低维度论文作者在github上整理了生成扩散模型领域近年各大改进方法,以及在计算机视觉、序列建模、音频、科学领域应用的相关论文和代码。

2024-03-09 11:15:09 1939

原创 CTR-GCN、HD-GCN:图卷积网络在骨骼动作识别中的应用(二)

CTR-GCN和HD-GCN是骨架动作识别中的两种方法,前者通过交叉时空卷积实现高效特征提取,后者通过基于图卷积的分层设计提升了动作识别的精度和鲁棒性

2023-11-23 11:38:03 5004 7

原创 ST-GCN、2s-AGCN:图卷积网络在骨骼动作识别中的应用(一)

ST-GCN和2s-AGCN是基于骨骼的动作识别框架,用于模拟人类骨骼数据中的空间和时间依赖性

2023-08-30 20:10:57 3711

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除