自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_41922853的博客

原创 MVX-net3D算法笔记

采用Pointfusion 和VoxelFusion实现了相机和点云的早融合。在KITTI数据集上包括5类别的鸟瞰数据和3D检测数据中获得前2名的数据。

2023-12-14 20:16:24 1557 2

原创 YOLOv3算法笔记

如果和0.3的ground truth重合，那它就是个负面的结果。作者分析YOLOv3下表的性能发现，在iou阈值0.5的情况下的性能和Retinanet及其变体的性能差得不多，但是当阈值调到0.75以后，性能会大幅度下降，这表明，YOLOv3的回归存在一定的问题，框很难与真值对得特别齐。和YOLOv2相同，YOLOv3同样采用基于anchor的方法，预测的值与YOLOv2也是相同，gird的左上角的偏移来得到中心cx, cy，bounding box的宽高便宜缩放得到宽高。这导致map下降了几个百分点。

2023-05-17 15:36:02 458

原创 YOLOv2算法笔记

预测种类更多，每个grid有5个anchor，每个anchor都有一个类别，与YOLOv1不同，这样总的预测向量为：13 x 13 x 5 x ( 5 + num_classes)。YOLOv2又名YOLO9000，作者说可以检测超过9000个类别，其主要由YOLOv1改进而来，文中还说可以采用检测数据集和分类数据集来联合训练YOLOv2。：采用多种分辨率的输入图片进行训练，因为网络中已经没有了全连接层，所有输入分辨率都是32的倍数，因为总的下采样倍数是32倍。最后选择k=5，设计高瘦的和矮宽的形状。

2023-05-16 15:18:35 274

原创 YOLOv1算法笔记

4、每个网格预测C个类别分数，所以每个grid参数就是：B * 5 + num_classes，原文中S取7，B取2，VOC数据集有20类，所以最后预测的tensor的维度是7 x 7 x (5 x 2 + 20)。损失函数如下：第一行中心坐标损失，第二行框宽高损失，第三行包含object的confidence损失，第四行不包含object的confidence损失（负样本置信度为0，正样本置信度为1），第五行类别预测损失。1、具有强烈的空间约束，一个grid预测两个box，仅仅只能有一类。

2023-05-15 15:36:00 164 1

原创 SOLO算法笔记

通常做实例分割：（1）先检测，再分割；（2）首先预测嵌入向量，然后使用聚类技术将像素分组到单独的实例中。本文：通过引入实例类别的概念，即根据实例的位置和大小为实例中的每个像素分配类别，从而很好地将实例分割转换为单镜头分类可解问题。

2023-04-28 10:39:32 339

原创 MASK RCNN算法笔记

在roi pooling当中，下采样以后，以及在划分格子进行pooling的过程中，均会出现小数点，这里都做了近似处理，会损失一定的精度。因为，roi aglin算法采用双线性插值，提取。非整数值位置处的特征值。示意图如图所示：参考。

2023-04-23 10:20:28 242

原创 edgeyolo算法笔记

yolox采用图b中的数据集增强方法，本文中采用多组mosaic进行mixup，分组数量可以根据数据集中单个图片中平均标签数量的丰富度来设置。整个训练分为三个过程，第一个过程中采用常规损失函数，iou损失采用giou损失，分类损失和置信度损失采用平衡交叉熵损失，规则损失置于0。与yolox相比，同样采用解耦头，但是采用了一个更轻量化的解耦头，同时，采用结构重参数化的手段，减少推理时间。最后采用个人数据集实际测试了一下，无论采用加强版数据集增强还是不采用加强版数据集增强的效果都不如yolox。

2023-04-19 15:10:33 387 3

原创 YOLOX算法笔记

具体地，将第一遍筛选得到的正样本计算得到一个cost矩阵。按照iou排序，得到前十个框，然后将是个iou值相加取整，作为动态k个候选框（小于1的取值1）。得到最终动态分配正样本的结果。模型中采用解耦头，针对三种不同分辨率，每一种分辨率输出特征图均将分类和回归解耦，一共有box头，回归头，置信度头（暂且这样称呼吧）。1、通过几何约束筛选第一遍anchor，具体函数见get_geometry_constraint，在每个gt中心画一个边长为3的正方形框，然后anchor中心在该正方形内的便是正样本。

2023-04-19 15:06:43 634

原创（最新）mmdetection测试单张/多张图片并保存

关于mmdetection框架上为了验证训练好的模型，将训练保存的模型用于测试单张图片的方法有很多，但是从mmdetectionv1.0rc1版本及以后的版本中，源代码有了一定的更新，但是官方文档上用于测试单张图片的方法还并未更新。网上相关教程也是老版本的教程，于是在此分享一下最新的方法。官方文档上测试单张图片方法：在mmdetectionv1.0rc1及以后的版本中，做了以下变更：1、show_result()函数被封装进了show_result_pyplot（）函数中。2、在show_r

2021-07-16 17:24:59 13039 39

原创 win10如何配置mmdetection2.14.0

1、安装vs20192、安装cuda11.13、安装anaconda4、安装mmcv1.3.8：（1)在anaconda中创建虚拟环境并安装python3.9。先打开：创建虚拟环境并安装python3.9(base) PS C:\Users\J01053585> conda activate mmdetection214(mmdetection214) PS C:\Users\J01053585>安装pytorch，见官网：https://pytor

2021-07-04 15:37:35 1381 3

原创 Anaconda恢复默认源，PackagesNotFoundError: The following packages are missing from the target environment

采用Conda创建虚拟环境安装python3.7：C:\WINDOWS\system32>conda create -n mmd214 python3.7报错：PackagesNotFoundError: The following packages are missing from the target environment: - python=3该报错是由于源中缺少相关库导致，参考：anaconda换源和恢复默认，解决失效问题更换源便可以了解决该问题。我通过命令：C.

2021-07-02 12:21:34 8358 2

原创（踩坑）Visual Studio Code（VS code）配置C/C++环境报错：launch: program ‘xxx‘ does not exist

关于VScode配置C/C++环境的教程很多，但是本人按照教程操作总是不能成功，最终将本人遇到的问题以及解决方案展示如下：根据教程https://www.cnblogs.com/bpf-1024/p/11597000.html，以此完成：1、VScode下载2、安装cpptool工具3、下载MinGW4、验证环境变量配置成功对于第5步，本人按照步骤：（1）新建文件夹code（2）在vscode软件中打开code文件夹（3）在code文件夹下新建一个test.cpp文件。

2021-07-01 14:38:20 48975 10

原创相机标定——相机模型详解

1、前言在图像处理或计算机视觉应用任务中，需要通过相机模型建立shi'ji相机镜头安装过程中可能导致相机镜头与成像平面不平行，由此可能会导致相机产生切向畸变误差；

2021-06-03 11:21:07 1123 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除