RISE128-CSDN博客

原创 DETR(Dectection Transformer)模型阐述

本文分析了DETR模型的Transformer架构，包括编码器的自注意力机制和解码器的交叉注意力机制。DETR采用CNN骨干网络提取特征，通过Transformer编码解码实现端到端目标检测，使用二分图匹配损失优化模型。相比传统检测模型，DETR无需锚框和NMS，流程更简洁，但存在收敛慢、小目标检测性能不足等问题。

2026-01-14 18:14:03 1145

原创 ViT(Visual Transformer)模型的原理架构

本文将详细讲述ViT模型的原理架构和对于图片处理的详细流程，以及后续使用ViT-B-16模型和ResNet-50分别对kaggle竞赛中猫狗大战数据集进行训练的效果对比。

2026-01-13 14:34:38 698

原创使用yolov8模型对划分和转换格式的Tinyperson数据集进行训练

摘要：本文介绍了Tinyperson小目标数据集的准备与YOLO格式转换过程。数据集包含717张训练图片和781张测试图片，从测试集中随机选取100张作为验证集。详细说明了数据下载、解压步骤，以及转换为YOLO格式的方法，包括生成对应的txt标注文件。最后展示了数据集配置文件和随机抽取图片的标注可视化效果。数据集地址为GitHub上的TinyBenchmark项目。

2025-12-30 21:10:41 322

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 DETR(Dectection Transformer)模型阐述

原创 ViT(Visual Transformer)模型的原理架构

原创 使用yolov8模型对划分和转换格式的Tinyperson数据集进行训练

空空如也

空空如也

原创使用yolov8模型对划分和转换格式的Tinyperson数据集进行训练