- 博客(8)
- 收藏
- 关注
原创 VisDrone数据集转为yolo格式工具
yolo算法有其独特的格式要求,为实现数据集能够便于计算特收集并编写几个python程序方便大家使用。特别说明其中部分程序主要思想及方法来源于DeepSeek大模型,如有不妥可联系删除。
2026-01-21 09:06:13
93
原创 马氏距离及相关知识
以二维随机变量为例:若对Ω中的每一个样本点ω都有一对有序实数(X(ω),Y(ω))与其对应,则称(X,Y)为二维随机变量或二维随机向量,称(X,Y)的取值范围为它的值域,记为Ω(X,Y)。设(X,Y)为二维随机变量,对任意的(x,y)∈R2,称F(x,y)=P(X≤x,Y≤y)为随机变量(X,Y)的分布函数。除以较大的协方差将有效缩短距离。若cov(X,Y)>0,即事件{X>E(X)}∩{Y>E(Y)}或{X<E(X)}∩{Y<E(Y)}发生的可能性更大,说明X和Y均有同时大于或同时小于各自平均值的趋势。
2025-07-07 08:52:22
504
原创 FFAVOD: Feature fusion architecture for video object detection (学习笔记)
我们使用1×1卷积来将多个帧的特征进行合并。然后,对这些张量进行二维卷积操作,卷积核的形状为1×1(1∗1∗(2n+1)),输出深度为1,得到c个形状为w ∗ h的张量。最后,我们将这些结果张量按通道方式进行拼接,得到w ∗ h ∗ c的特征图,即输出的特征图。架构的核心思想是:只计算视频中每帧的特征图一次,在进行目标帧的检测时,使用已经计算好的、时间上接近的帧的特征图来增强目标帧的特征图。例如,当无法访问t−2,但可以访问t−1时,如果n = 2,我们将使用五帧:t−1,t−1,t,t+1和t+2。
2025-05-20 10:58:37
1360
原创 学习《基于时序特性的视频目标检测研究》笔记
在视频序列中,根据视频时序连续的特性,当前 ChaoXing160 2021 年第 2 期 帧 t 与前序帧 t - 1 的检测结果保持连续,本文使用 结果反馈的后处理策略,通过前序帧 t - 1 的检测结 果判断与矫正当前帧的 t 的检测错误,提升视频检 测的准确率,处理流程如图 2 所示。本文提出 双模型检测,流程如图 3 所示,实时模型负责逐帧检 测,精度模型负责采样检测,并使用精度模型检测结 果矫正实时检测的结果。,减少帧间的冗余计算来加速检测,解决视频运动模糊与部分遮挡等问题来提高检测质量。
2025-05-07 11:01:15
972
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅