kyrie变相不减速-CSDN博客

原创 DETR训练自己的数据集

本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。该数据集原始的标签保存格式为yolo类型的txt文件，下面提供的代码能够实现数据集标签从txt文件到coco json格式的转化.该部分为利用训练得到的模型权重进行检测验证。在detr工程文件下的images文件夹存放所有待验证的图片，infer_results存放所有的验证结果。DETR需要的数据集格式为coco格式，其原始图片与标签分为训练集和验证集，其保存目录为。output_dir为保存训练得到的模型权重的地址。

2022-12-09 17:02:32 9500 18

原创 VPGNet数据集解析且将分割标签转化为目标检测标签

VPGNet是一个包含了四个场景(晴天，夜间，阴雨等）下的交通路况数据集，其主要是针对地面标志（箭头线，人行道）的任务，该数据集一共包括以下17类地面标注该数据集下载地址为：VPGNet数据集下载下载解压得到的数据集文件格式为Scene_x—%datetime_aaa_xxx-----id.mat该数据集的所有有用信息均保存在一个(6404805)的mat文件中。数据集的关键信息均保存在(6404805)的数组中，前三个通道为图片的rgb三通道信息，第四维通道为图像的17类二值分割图像(像素值为

2022-12-06 16:30:19 2378 9

原创 DETR、conditional DETR、Deformable DETR

DETR是将transformer机制应用到目标检测领域的算法模型。其主要思想是利用transformer的encoder-decoder架构，利用注意力机制来实现端到端获得目标检测的结果。如图所示为DETR模型的结构，其主要由backbone，transformer block，prediction heads三部分组成。backbone作为输入图像的初步特征提取，主要由卷积神经网络如(resnet50)完成，对于输入图像(B×3×H×W），其中B为batch_size,H,W为图像的宽高。

2022-11-22 18:00:25 2714

原创 VIT模型个人笔记

前言VIT模型即vision transformer，其想法是将在NLP领域的基于自注意力机制transformer模型用于图像任务中，相比于图像任务中的传统的基于卷积神经网络模型，VIT模型在大数据集上有着比卷积网络更强的效果和更节约的成本。transformertransformer模型...

2022-03-01 10:07:20 13101 1

原创图注意力网络（GAT）

一、图数据结构知识图是指一系列相互连接的节点，且每个节点自己也具有一定的特征。如下图所示即一个典型的图结构。该图一共有五个结点，每个结点有自己的特征Fi.另一方面，为了描述图的结构特点，常用邻接矩阵A和度矩阵D.其中，对于一个N个结点的图来说，邻接矩阵A为一个大小为N*N的对称矩阵，若两个结点i，j直接有连接，则Aij=Aji=1，否则为0.度矩阵D大小同样，除对角线上，其余位置的值均为0，Dii的值为与结点i直接连接的结点的数目。实际处理中还存在一种常见的矩阵拉普拉斯矩阵L，L=D-A。二、图注

2022-02-02 20:54:21 23097 4

qq_45836365的博客

原创 DETR训练自己的数据集

原创 VPGNet数据集解析且将分割标签转化为目标检测标签

原创 DETR、conditional DETR、Deformable DETR

原创 VIT模型个人笔记

原创图注意力网络（GAT）

原创 YOLO V3个人笔记

原创 YOLO v2算法改进理解（自己的笔记理解)

原创 2021-10-04

空空如也

空空如也