YOLO
文章平均质量分 82
Mr.Q
纸上得来终觉浅,绝知此事要躬行。 ---陆游
展开
-
对比yolov4和yolov3
总体而言,yolov4是尝试组合一堆tricks,获取得到的模型,该模型具有训练更快、模型更轻、精度更高的特性。原创 2023-02-22 22:00:00 · 2286 阅读 · 0 评论 -
VOC Dataset (解析voc数据集、mosaic增强、voc转labelme)
自定义的目标检测Dataset示例原创 2021-12-21 17:07:07 · 1673 阅读 · 5 评论 -
经典论文回顾-YOLOv1(代码详解)
yolo v1代码逐行解析原创 2021-12-22 18:00:22 · 3876 阅读 · 9 评论 -
yolox Head-Decoupled head源码解读
前言yolox backbone部分介绍yolox neck部分介绍yolox:https://github.com/Megvii-BaseDetection/YOLOXyolox详细解读可参考:https://jishuin.proginn.com/p/763bfbd628ceyolox网络结构yolox head网络结构head组件及对应源码三个大分支输入的是三种尺度特征图,自下而上分别对应前面提到的backbone输出的dark3, dark4, dark...原创 2021-08-19 14:09:26 · 8077 阅读 · 6 评论 -
yolox Neck-fpn源码解读
前言yolox backbone部分介绍yolox:https://github.com/Megvii-BaseDetection/YOLOXyolox详细解读可参考:https://jishuin.proginn.com/p/763bfbd628ceyolox网络结构yolox Neck网络结构可以发现,yolox Neck部分和yolox v3的neck是一样的,且都是fpn结构。Neck组件由上图可知有四种组件:CBL:conv1x1的卷积+BN+Lea..原创 2021-08-18 09:29:21 · 1452 阅读 · 0 评论 -
yolox backbone-darknet53源码解读
学习备忘。yolox:https://github.com/Megvii-BaseDetection/YOLOX详细解读可参考:https://jishuin.proginn.com/p/763bfbd628ce或者去大佬的公众号。大佬个人的网站。目录yolox-darknet53网络结构backboneCBL模块ResUnit单个残差块Resx模块yolox-darknet53网络结构backbone源码对应的文件是yolo_fpn中类YOL原创 2021-08-17 19:01:02 · 2931 阅读 · 3 评论 -
Tensor的view, reshape, resize, permute, transpose, contiguous操作
1. view(返回视图)功能是返回一个新的Tensor,这个Tensor具有之前相同的元素,只不过shape不同。>>> x = torch.randn(4, 4)>>> x.size()torch.Size([4, 4])>>> y = x.view(16)>>> y.size()torch.Size([16])>>> z = x.view(-1, 8) # the size -1 is .原创 2021-04-27 18:08:45 · 1198 阅读 · 1 评论 -
unable to get repr for <class ‘torch.Tensor‘>
问题描述:计算BCE Loss使用pytorch接口self.bce_loss = nn.BCELoss()self.bce_loss(pred_cls, tcls)问题原因:pred_cls没有归一化的0到1之间。解决办法:self.bce_loss(torch.sigmoid(pred_cls), tcls)原创 2020-11-02 09:19:45 · 2561 阅读 · 0 评论 -
PyTorch实现YOLOv3
1, 网络结构左边Darknet网络结构,右边YOLOv3网络结构,详细解析可参考链接 2, pytorch代码实现# -*- coding: utf-8 -*-# @Time : 2020/10/20 下午10:17# @Author : zxq# @File : YOLOv3_model.py# @Software: PyCharmfrom collections import OrderedDictimport t...原创 2020-10-21 22:55:17 · 1804 阅读 · 0 评论 -
YOLOv3-step1根据网络预测结果求预测框
def predict_transform(prediction, inp_dim, anchors, num_classes, CUDA=True): """ https://blog.paperspace.com/how-to-implement-a-yolo-v3-object-detector-from-scratch-in-pytorch-part-3/ :param prediction: [2, 255, 13, 13]. 这个255=(1+4+80)*3 :.原创 2020-10-20 14:51:43 · 400 阅读 · 0 评论 -
YOLOv3-step2过滤多余的预测框
def write_results(prediction, confidence, num_classes, nms_conf=0.4): """ subject our output to object score thresholding and Non-maximal suppression [b, 13*13*3 + 26*26*3 + 52*52*3, 85] -> [B, D, 8]. 8=[x1, y1, x2, y2, obj_score, cls_score.原创 2020-10-20 20:07:33 · 1356 阅读 · 0 评论 -
YOLOv3-step3可视化预测结果
def write(x, results): """ 把num_batch个预测结果,画在对应的图像上。 :param x: tensor. shape is 8. [img_index, x1, y1, x2, y2, object_score, cls_score, cls) :param results: list. 对应的原图 :return: """ c1 = tuple(x[1:3].int()) # x1, y1 c2 = t.原创 2020-10-18 16:52:57 · 646 阅读 · 1 评论 -
python和c++实现 不改变长宽比缩放图片
python和c++实现,保持长宽比缩放图片。原创 2020-10-18 09:49:53 · 1383 阅读 · 1 评论