自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 TransVOD框架图的各部分讲解

本文就TransVOD的框架图的各个部件进行了作用的阐述及其维度变化。

2025-10-13 20:57:23 563

原创 TPAMI - 2023 | TransVOD: End-to-End Video Object Detection

本文提出TransVOD,一种基于时空Transformer的端到端视频目标检测框架。该方法通过时间Transformer关联多帧信息,包含三个关键组件:时间可变形Transformer编码器(TDTE)聚合空间特征,时间查询编码器(TQE)融合目标查询,以及时间可变形Transformer解码器(TDTD)输出检测结果。进一步提出改进版本TransVOD++(引入动态卷积和难查询挖掘)和TransVOD Lite(片段级建模提升速度)。实验表明该方法在简化流程的同时取得优异性能,无需后处理即可实现高效视频

2025-10-03 12:41:42 915

原创 Arxiv | 2024 | Practical Video Object Detection:通过特征选择和聚合进行实用的视频对象检测

本文提出FSM、FAM模块用于特征的筛选与增强,并引入时序参数来关联前后帧

2025-09-27 20:41:28 735

原创 《Mini-o3:扩大视觉搜索的推理模式和交互转折》论文解析

有关Mini-o3:扩大视觉的推理模式和交互转折搜索 的讲解

2025-09-10 22:02:50 1701

原创 YOLOV++两大板块解析

关于YOLOV++中FSM、FAM的详细讲解

2025-07-31 15:04:50 1999

原创 YOLOV++的forward代码详解

本文基于YOLOV++代码及其框架图进行详细讲解

2025-07-12 10:37:19 1900

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除