- 博客(3)
- 收藏
- 关注
原创 DETR(Dectection Transformer)模型阐述
本文分析了DETR模型的Transformer架构,包括编码器的自注意力机制和解码器的交叉注意力机制。DETR采用CNN骨干网络提取特征,通过Transformer编码解码实现端到端目标检测,使用二分图匹配损失优化模型。相比传统检测模型,DETR无需锚框和NMS,流程更简洁,但存在收敛慢、小目标检测性能不足等问题。
2026-01-14 18:14:03
1145
原创 ViT(Visual Transformer)模型的原理架构
本文将详细讲述ViT模型的原理架构和对于图片处理的详细流程,以及后续使用ViT-B-16模型和ResNet-50分别对kaggle竞赛中猫狗大战数据集进行训练的效果对比。
2026-01-13 14:34:38
698
原创 使用yolov8模型对划分和转换格式的Tinyperson数据集进行训练
摘要:本文介绍了Tinyperson小目标数据集的准备与YOLO格式转换过程。数据集包含717张训练图片和781张测试图片,从测试集中随机选取100张作为验证集。详细说明了数据下载、解压步骤,以及转换为YOLO格式的方法,包括生成对应的txt标注文件。最后展示了数据集配置文件和随机抽取图片的标注可视化效果。数据集地址为GitHub上的TinyBenchmark项目。
2025-12-30 21:10:41
322
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅