Jiangnan_Cai-CSDN博客

YOLOv6 是美团推出的，在这个版本里面，不再使用之前 YOLOv4 和 YOLOv5 的带 CSP 结构的 CSPDarknet-53 作为 backbone 了，而是在 RepVGG 的启发下，推出了新的 EfficientRep 作为 YOLOv6 的 backbone。简单来说，在训练和推理的时候采用不同的结构，在训练的时候采用多分支结构进行训练，但是在推理的时候使用单分支，即保留了训练多分支的准确度，又兼具推理时单分支的速度。

2024-04-01 13:39:54 2278

原创【目标检测】YOLOv5 网络结构，bottleneckCSP 与 C3 模块图解

YOLOv5 作为 YOLO 家族的第五个版本，本身也演进了几个子版本，现在网上的资料都没有标注具体是哪个子版本的，导致不同文章之间各种混乱，像是盲人摸象。其实官方的里对各个版本的变动其实都讲得非常清楚了。下面简单说一下各版本用到的模块：V1.0版本V2.0版本在V1.0版本基础上删去nn.Conv2d，并且Detect指定为17, 20, 23层输出。V4.0版本用C3代替了BottleneckCSP，而其他的结构不变。CBL 也换成了 CBS，使用 SiLU 作为激活函数。

2024-03-29 09:09:03 6986 5

原创图解 python 的赋值，浅拷贝，深拷贝

但是因为对象是列表，内部还有子对象，在浅拷贝的时候，会对他们的引用进行复制，所以子对象的引用是没有变的，但是你修改不可变元素的时候，实际上不是在修改它的值，而是将它的引用去掉，然后用新的引用指向新的值。所以 a[0] 修改之后，c[0] 还会是原来的值。，实际上两者的引用是一样的，相当于 b 只是 a 的另外一个名字，不管是对 a 或者 b 内的可变元素还是不可变元素修改，打印 a, b 两者都是一样的。但是如果是深拷贝的，相当于递归进行分身，不管是顶层对象，还是子对象，都会递归进行拷贝，也就是所谓的“

2024-03-27 17:34:17 291

原创【目标检测】YOLOv4 网络结构

YOLOv4 的网络结构

2024-03-27 14:37:51 1333

原创 python 基于 websocket 的简单将视频推流到网页

websocket, python, opencv, html

2024-03-20 17:26:01 2851

原创【目标检测】图解 YOLOv3 的网络结构（Darknet-53 作为 backbone）

Darknet-53 作为 backbone 的 YOLOv3 网络结构图解

2024-03-19 15:56:16 1394

原创【目标检测】YOLOv2 网络结构（darknet-19 作为 backbone）

YOLOv2 网络结构

2024-03-18 17:13:03 1652 3

原创【目标检测】原始的 YOLOv1 网络结构（GoogLeNet 作为 backbone 的实现）

yolov1 使用 GoogLeNet 作为 backbone 的网络结构实现全解析。

2024-03-16 17:24:30 975

原创【阅读笔记】通俗易懂的 transformer 笔记

这篇文章是关于《如何从浅入深理解transformer》的一个阅读笔记。因为是第一次接触 transformer，找了半天，感觉这篇文章作为入门来说还不错，可以将整个发展的历程串联起来讲。但是这毕竟是一篇阅读笔记，我只会对个人不太清楚的概念详细了解。

2024-03-06 14:23:09 694

原创文章中出现的问题汇总

我将文章评论区中的比较有价值的评论提问在这里汇总，供大家一起学习参考，如果大家对下面的问题有解答的话，也可以在评论区帮忙解答。

2024-02-06 16:11:28 311

原创【图像处理理论】【SIFT】SIFT 极值点拟合的详细推导过程

从高斯差分函数的泰勒展开，一步一步推导，从求导到代入求极值的过程

2023-11-29 23:47:27 613 3

原创聚焦清晰度评价指标所用到的各种算法

本文涉及到各种聚焦清晰度评价算法，包含Variance，brenner, tenengrad, eog，robert，laplace，一阶高斯导，image power，vollath，entropy，log histogram，还有一些国人提出的 SMD，SMD2，PAV点锐度，NRSS无参结构相似度量。后续会加上代码实现

2023-11-29 10:41:32 1898

原创 opencv 没办法控制焦距怎么办？来试一下 pyuvc 吧

opencv 没办法控制焦距怎么办？来试一下 pyuvc 吧

2023-11-22 17:53:29 1416

原创【目标检测】RCNN 的边界框回归损失函数

从 rcnn 的边界回归讲到岭回归与最小二乘法

2023-11-13 11:56:16 840

原创工业相机参数计算

靶面尺寸和像元尺寸的计算

2023-11-08 10:54:53 377

原创【目标检测】SSD损失函数详解

SSD 损失函数详细解析

2023-11-06 16:50:15 957

原创【深度学习基础】归一化，白化，

当然，除了对图像的像素值进行归一化，在目标检测的 YOLO 家族中，我们也会对目标框的坐标和宽高进行归一化处理。归一化后数值落在哪个区间对后续的训练有什么影响呢？但是上面有几个答案都提到了归一化到。是一种更为推荐的归一化方式。

2023-10-30 17:26:04 185

原创【linux v4l2】关于 v4l2 select() timeout 这个问题

v4l2 timeout 问题

2023-10-20 16:32:09 2933

原创【mediapipe嵌入式实战02】使用libmediapipe编译静态库，并解读实例代码

读完这个 example.cpp 文件之后，稍微改动一下，我就顺利的跑出了自己的 face landmarks，但是有一个问题就是有几个 detection 相关的 graph，最后输出的数据格式是 mediapipe::Detection 格式的，libmediapipe 好像没有做这个转 rect 之类的接口，所以没办法直接使用。可能得自己在头文件上补上，然后重新编译才行。不过我也只需要 face landmarks 的，所以也就不管了。

2023-09-27 11:27:59 1029 9

原创【mediapipe嵌入式实战01】Linux环境的mediapipe编译（快跑）

最近想要将 mediapipe 中 facemesh 这个功能移植到硬件上，所以第一步是要编译一下 mediapipe，因为 mediapipe 是谷歌出的，自然也是要用 google 的 bazel 编译器进行编译。只是第一次接触，踩的坑有点多，花了将近 3 天的时间才成功地编译。首先说一下我的系统的是 centos 8，gcc 版本是 8.5，opencv 的版本是 4.1.2。

2023-09-22 11:34:10 1659

原创 BN 层并不能完全避免梯度消失和梯度爆炸的发生

BN 不能完全避免梯度消失和梯度爆炸，只能够缓解

2023-09-13 09:33:37 322

原创 VarifocalLoss 源码实现解读及其在 Yolov8 中的应用

解读 varifocal loss 的源码，加深理解

2023-09-12 08:58:34 2202 24

原创一步步理解花式索引（fancy index）

从零一步步推导和理解numpy和pytorch中的花式索引

2023-09-07 16:35:40 235

原创【算法手撕代码】手撕 IOU 与 NMS（Pytorch实现）

最后返回的 keep 理论上最大可能保留了所有的候选框，就是如果你的 threshold 设置得很大的时候，例如 0.99 之类的。最少应该也能保留一个 score 值最大的候选框吧。

2023-09-04 13:33:38 693

原创【YoloV1】损失函数最贴近公式的实现+解读（pytorch）

最简单理解的yolov1损失函数代码

2023-08-11 14:50:48 733

原创浅入浅出讲解 Inception 家族的网络（万字长文）

在 Inception 之前，人们的路径依赖就是，通过更深的卷积层级来获得更高的准确率和性能，但是这种无脑加深网络的方式导致参数量变大，随之而来 2 个显而易见的问题，第一是容易过拟合，第二是需要更多的计算资源。与 Inception V1(GoogLeNet) 同年推出的 VggNet 是当时的集大成者，它可以提供很深的层级和很好的泛化能力，而且在多项任务中都获得了很好的效果。

2023-08-08 14:22:38 2256 1

原创【数据集】英文手写字母数据集处理

【代码】【数据集】英文手写字母数据集处理。

2023-07-24 11:50:52 1443 1

原创《CUDA C++ Programming Guide》阅读笔记（每页要点总结）

零基础，之前跑过一点 python ，几乎没有搞过 C++。这次会利用 chatGPT 辅助阅读这本官方手册。学习 CUDA 编程。最终要达到啥效果呢，希望可以读懂 cudasift 的源码。

2023-07-06 11:28:04 450

原创特征检测 + 匹配

orb, surf, sift, superpoint, superglue, fast, brief, bfmatch, flann

2023-04-26 16:04:24 150

原创 Linux安装cuda，cudnn，tensorRT完整流程

cuda，cudnn，tensorRT安装，tensorrt和cuda的python API接口库安装

2022-10-19 10:36:33 8489 9

原创图像处理：形态学处理

scikit-image和opencv相关的形态学处理

2022-10-14 17:42:06 908

原创简单的四则运算识别计算网络

CROHME数据集提取，MobileNet，四则运算

2022-10-13 17:49:32 1106 10

原创 pytorch

也就是说，reshape操作也不一定会开辟新的内存空间，如果tensor是连续的话，实际上调用的view的实现，而当tensor不连续且步长不兼容的时候，就会对tensor进行深拷贝。相当于tensor的一个引用，通过它会直接对原tensor进行操作，不会产生拷贝，只能对满足张量连续性条件（contiguous）的tensor进行操作。：通过加载了权重的模型实例来进行调用，可以查看模型的全部参数。对tensor的维度进行交换之后，才会不满足条件，这时候就需要使用。可以对任意tensor进行操作，相当于。

2022-10-10 17:44:33 663

空空如也

空空如也