mikko_6214-CSDN博客

原创 yolov2学习笔记

在yolov1中，每个grid cell有两个bounding box，bounding box的中心坐标由它与grid cell的中心的偏移量确定，但因为偏移量可能很大，所以bounding box的中心不一定被限制在grid cell中，也就是它属于grid cell1，但它的中心有可能落在grid cell2中。聚类算法最重要的是选择如何计算两个边框之间的“距离”，对于常用的欧式距离，大边框会产生更大的误差，但我们关心的是边框的IOU。最常见的检测数据集包含数千到数十万张带有数十到数百个标签的图像。

2024-07-20 18:12:24 858

原创目标检测常用评价指标

通常，目标检测算法使用 IoU 来匹配预测边界框与真实边界框，设定一个IoU阈值，只有当预测框与真实框的IoU超过这个阈值时，才认为是有效匹配。评价单一类别的平均精确率，是 Precision-Recall 曲线下的面积。通过遍历不同阈值的IoU值绘制PR曲线。评价所有类别的平均精确率。N是总的类别数量，APi是第i个类别的AP值。评价算法预测的精确率，预测为正例中真正为正例的比例。评价算法预测的漏检率，所有实际正例中被正确识别出来的比例。

2024-07-09 10:46:00 462

原创 YOLOv1论文学习笔记

之前的目标检测通常为分类问题，而YOLO将目标检测重新定义为回归问题。过去的目标检测通常是一个两阶段问题：第一阶段：候选区域生成和特征提取。第二阶段：分类与回归及后处理。这种方法通常需要分步骤地处理每个目标候选区域，因此在速度和精度上存在一定的折衷。但是YOLO可以实现端到端的检测。因为YOLO使用一个单独的神经网络，既可以预测预测框的坐标，也可以预测类别，它直接全图输入，神经网络在一次前向推断后就能够输出目标的坐标和类别。

2024-07-06 15:04:33 595

原创 Pytorch笔记--卷积操作

在卷积核移动的时候中间位置都被计算了，而输入图像二维矩阵的边缘却只计算了一次，可能会导致计算的结果不准确，所以为了让每个方块都能作为卷积窗口的中心，从而提高准确度就进行了padding。滑动卷积核时，我们会先从输入的左上角开始，每次往左滑动一列或者往下滑动一行逐一计算输出，我们将每次滑动的行数和列数称为stride。stride就是缩小的具体倍数，比如步幅为2，输出就是输入的1/2；步幅为3，输出就是输入的1/3。在矩阵的边界上填充一些值，以增加矩阵的大小（通常填充0），填充的圈数就是padding的值。

2024-05-10 18:55:46 391

原创 Pytorch笔记--dataloader的使用

torchvision中的datasets类提供了一些常用的数据集，下面以CIFAR10数据集作为例子介绍一下它的用法。一中对datasets中的数据集的使用相当于创建了一副纸牌，而dataloader就用于发牌以及使用这副牌。root: 数据集的根目录，如果download为True，数据集将会保存在该目录下。drop_last：当样本数量不能被batch_size整除时，是否舍去最后一批数据。train: 默认为True，True为训练好的数据集，False为测试数据集。dataset：处理的数据集。

2024-05-10 10:45:24 181

原创 Pytorch笔记--transforms的使用

transform主要是对图片进行变换，用到的是transforms.py文件中的类。所以在不知道使用某个工具时图片的输入、输出格式，可以通过查阅transforms.py文件的官方文档。按照[width,height]的尺寸裁剪图片。，通过工具可以将图片变换成我们需要的形式。按照[size,size]的尺寸裁剪图片。处理，有助于模型更快收敛，提高模型的性能。在使用中要特别注意的是：使用工具时。表示将图片的宽度和高度调整到指定尺寸。括号中是一个整数，表示将图片的。，文件中的类就是一个个。

2024-05-07 18:10:26 357

原创 Pytorch笔记--TensorBoard的使用

TensorBoard是Google开发的一个机器学习可视化工具。其主要用于记录机器学习过程如果终端里面没有显示你创建的虚拟环境名称，例如(base), (pytorch)等，而是ps：说明没有进入到虚拟环境当中只要敲一下：conda activate pytorch（pytorch是我创建的虚拟环境名称）就好了！如果你还是进入不了的话，可以在设置里面打开工具里面的终端，把shell路径改成cmd的然后打开终端，点击上面这个箭头换成prompt。

2024-04-26 20:39:03 548 1

原创 pytorch笔记---Dataset类

列出指定目录下的所有文件和目录，包括隐藏文件，并以列表方式打印。os模块提供各种 Python 程序与操作系统进行交互的接口。path.join()函数。将指定的几个路径合在一起。listdir()函数。

2024-04-25 00:24:25 198 1

原创滑动窗口——单调队列

大致思路为：将每一个可能成为最大（最小）值的数存入队列。比如说当求最大值时，当前值为3此时队尾值为1，那么1已经没有成为最大值的可能了所以去除。相反如果当前值比队尾小，那么他在未来有可能成为某一时刻的最大值所以存入队列。第 2 行：N 个整数，表示数组的 N 个元素(≤2×109≤2×109)；第一行为滑动窗口从左向右移动到每个位置时的最小值，每个数之间用一个空格分开；第二行为滑动窗口从左向右移动到每个位置时的最大值，每个数之间用一个空格分开。你的任务是找出窗体在各个位置时的最大值和最小值。

2024-02-01 15:25:08 271 1

原创逛画展——尺取/单调队列

这里同样用了和上一种方法相同的两个数组存储信息，需要注意的是，每录入一个数据都要判断它的作者是否与队头的作者重复，重复则删去队头作品，这时队头数据更新，我们还要判断更新后的队头作品作者是否出现超过1次，超过则去除，直到队头作品作者只出现一次。蒜头君想到博览馆去看这几位大师的作品，可是那里的博览馆有一个很奇怪的规定，就是在购买门票时必须说明两个数字 a 和 b，代表他要看展览中的第 a 幅至第 b 幅画（包含 a 和 b）之间的所有图画，而门票的价钱就是一张画一元。保证有解，如果多解，输出a最小的。

2024-02-01 14:27:09 348 1

原创 [CSP-J2020] 方格取数——动态规划

之前做的常规动态规划只有向下或向右两个选择，如果按照之前的思路（当前的状态只与上一行有关，并且上一行的状态已经为定值），是不可行的，因为我们可以向上走，即改变上一行的状态，但是可以发现在每一列中当前状态只与上一列（定值）有关，那么我们就可以确定dp数组的遍历顺序——现有一只小熊，想从图的左上角走到右下角，每一步只能向上、向下或向右走一格，并且不能重复经过已经走过的方格，也不能走出边界。小熊会取走所有经过的方格中的整数，求它能取到的整数之和的最大值。一个整数，表示小熊能取到的整数之和的最大值。

2024-01-29 22:15:10 455

2302_79365810的博客