吹个泡泡111-CSDN博客

原创 YOLO-V4

2.数据增强：调整亮度、对比度、色调、随机缩放、剪切、翻转、旋转。1.Random Erase：用随机值或训练集的平均像素值替换图像的区域。1.V3中为了更好满足不同输入大小，训练的时候要改变输入数据的大小。2.网络细节部分加入了很多改进，引入了各种能让特征提取更好的方法。3.注意力机制，网络细节设计，特征金字塔等，你能想到的全有。1.只增加训练成本，但是能显著提高精度，并不影响推理速度。1.之前的dropout是随机选择点(b) ，现在吃掉一个区域。

2023-11-20 15:54:02 23 1

原创 YOLO-V3

26*26特征图上：(30x61)，(62x45)，(59x119)（2）13*13特征图上：(116x90)，(156x198)，(373x326)52*52特征图上：(10x13)，(16x30)，(33x23)（2）logistic激活函数来完成，这样就能预测每一个类别是/不是。（1）YOLO-V2中选了5个，这回更多了，一共有9种.为了能检测到不同大小的物体，设计了3个scale。（1）物体检测任务中可能一个物体有多个标签。（1）没有池化和全连接层，全部卷积。（3）3种scale，更多先验框。

2023-11-20 15:37:02 24 1

原创 YOLOV1和YOLOV2

2.很明显，堆叠小的卷积核所需的参数更少一些，并且卷积过程越多，特征提取也会越细致，加入的非线性变换也随着增多，还不会增大权重参数个数，这就是VGG网络的基本出发点，用小的卷积核来完成体特征提取操作。（1）通过引入anchor boxes，使得预测的box数量更多（13*13*n）。（2）可能导致模型水土不服，V2训练时额外又进行了10次448*448的微调。都是卷积操作可没人能限制我了！（1）V1训练时用的是224*224，测试时使用448*448。（2）网络的每一层的输入都做了归一化，收敛相对更容易。

2023-11-20 15:30:04 82 1

原创深度学习-目标检测

（2）anchor-free anchor-free是自底向上的想办法自动生成，不穷举 free掉了anchor的预设过程。（1）anchor-base是自顶向下的类似于传统方法，滑动窗口法穷举出许多，然后再根据置信度之类的进行筛选。2.VOC(XML)格式： (Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。（1）经典发展线：R-CNN、SPP-Net、Fast R-CNN、 Faster R-CNN。（3）候选框列表中的所有框依次与A计算IoU，删除大于阈值的候选框。

2023-11-20 15:15:35 45 1

原创深度学习-卷积神经网络

输入层即输入的图片等数据，卷积层是用来进行卷积运算的层次，池化层通常在卷积层之后用来减少数据的复杂性和内存占用，全连接层则用于将前面的层次连接起来形成一个完整的网络。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。• AlexNet的架构与LeNet相似，但使⽤了更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。

2023-11-06 16:20:25 74

原创感知机相关知识

因此发现了一种新的划分方式，简单来说用非线性的曲线划分出非线性空间，而这一概念正是多层感知机——最简单的深度神经网络。1.感知机（Perceptron）是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。（3）激活函数的导函数的值域要在一个合适的区间内，不能太大也不能太小，否则会影响训练的效率和稳定性。2.多个隐藏层多类分类，超参数：隐藏层数量,多少层隐藏层每层的隐藏单元数目，隐藏层神经元个数。1.前向传播（正向传播）输入样本——输入层——各隐藏层——输出层。

2023-11-03 14:07:56 137

原创线性回归和softmax回归

1.基本概念：线性回归是一种基本的预测型分析，它试图通过找到一个最佳拟合线（或平面）来预测一个连续型变量（例如销售额、温度等）和一个或多个预测变量（例如时间、广告投入等）之间的关系。7.梯度算法流程：在梯度法中，函数的取值从当前位置沿着梯度方向前进一定的距离，然后在新的方向重新求梯度，再沿着新梯度的方向前进，如此反复，不断的沿梯度方向前进。2.线性回归的基本公式是：Y = aX + b，其中Y是我们要预测的连续型变量，X是预测变量，a和b是模型参数，需要我们通过计算来找到。二、Softmax回归。

2023-11-02 15:18:25 35

原创机器学习相关算法

一般来说，只选择样本数据集中k个最相似的数据。1.逻辑回归是用来做分类算法的，可以把Y的结果带入一个非线性变换的Sigmoid函数中，即可得到[0,1]之间取值范围的数S，S可以把它看成是一个概率值，如果我们设置概率阈值为0.5，那么S大于0.5可以看成是正样本，小于0.5看成是负样本，就可以进行分类了1。超平面：超平面H是从n维空间到n-1维空间的一个映射子空间，它有一个n维向量和一个实数定义如果空间是三维的，那么它的超平面是二维平面，而如果空间是二维的，则其超平面是一维直线超平面可以使用方程表示。

2023-11-01 16:53:03 40 1

Helen0721的博客