自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 SSD详解

1. 使用anchor box作为候选框,特定的anchor box的计算规则;2. 在不同层次的feature map上提取anchor box,用来预测不同尺度大小的图像;3. 在同一个feature map上,使用不同高宽比的anchor box;4. 使用膨胀卷积增大感受野;5. 正负样本的划分方式;

2024-01-29 21:07:13 1488

原创 GoogleNet Inception v2 和 Inception v3详解

v1具体结构:v2具体结构:Inception v2在每个卷积层之后引入了BN。这有助于解决深层网络中的梯度消失问题,同时加快训练过程并提高模型的收敛速度。BN通过减少内部协变量偏移,使每一层的输入更加稳定。Inception v2采用了更多的3x3卷积核代替大尺寸卷积核。这种设计可以减少参数数量,从而减少过拟合的风险,并降低计算复杂度。Inception v2将大尺寸的卷积核(如5x5)分解成两个较小的卷积核(如3x3)。这不仅减少了参数的数量和计算量,还保持了网络的表达能力。如下图在v1中,只改变了,第

2024-01-29 18:50:10 878

原创 GoogleNet v1结构和代码复现

Top5错误率6.7%;使用9个inception模块, 改变CNN原串行结构, 并行, 共22层;使用平均池化替代FC层;参数量仅为AlexNet的1/12;使用softmax获取平均结果;网络结构的更新, 性能比AlexNet要好;2014年ILSVRC冠军。下面是他的具体参数其实感觉对于GoogleNet结构除了inception结构和多出来的两个输出结构并没有什么好介绍的,具体介绍下inception结构,和那两个输出结构2 inception结构。

2024-01-29 16:30:14 282

原创 VGGNet的结构和复现

上述为VGGNet的结构图,左边是VGG16D的步骤 16代表16层,有参数的层,其他结构也是如此对于这6个机构来说,D中的VGG16是最优的,而VGG19相比较而言,没有VGG16优,VGG16有16层(包括13个卷积层和3个全连接层),而VGG19有19层(包括16个卷积层和3个全连接层),对于出现了的模型退化问题,有几个原因:1 网络层次越深,提取的特征越是高度抽象,这可以帮助模型理解复杂的、高级的模式。

2024-01-28 15:13:20 166

原创 AlexNet,ZFNet详解

网络结构对于AlexNet网络来说,因为当时资源环境受限,他从第一步卷积开始就把一个图像分到两个GPU上训练,然后中间进行组合最后进行融合成全连接成1000个置信度1 得到一张3x224x224的图像,然后进行11x11的卷积,卷积两次,分别分配到不同的GPU上分别得到,两个48x55x55的feature map,然后进行最大池化操作从48x55x55变成48x27x27。

2024-01-27 21:56:08 471

原创 LeNet跟LeNet5详解

主要是为了手写数字识别具体结构讲解:从图中例子可得1 先传入一个灰度图像尺寸为1x28x28,通道数为1,尺寸为28x28的灰度图像2 第一层5x5卷积,经过公式 输入图像尺寸-卷积核尺寸+2padding/步长+1,(其中,因为是正方形,所以长宽都一样,直接一个式子得出)因为没有padding,输出特征图20个通道,24x24的尺寸。3 经过第二层Pooling层,计算方式同上,得到20x12x124 在经过第三层5x5卷积,输出50x8x8,5 第四层Polling,得到50x4x4。

2024-01-27 20:35:13 727

原创 LN,IN,GN,SN归一化原理详解

在Layer Normalization中, 是针对不同样本计算当前样本的所有神经元的均值和方差, 也就是说在LN中, 同层神经元输入拥有相同的均值和方差, 不同的输入样本具有不同的均值和方差;而在BN中, 同层的不同神经元输入的是不同的均值和方差, 而同一个batch中的所有样本拥有相同的方差和均值上述是类似全连接的时候,下面是有通道的时候BN的是对不同样本的同一个通道的每个位置分别计算均值和方差,并用这些统计量对该位置上的值进行归一化而LN具体的计算方式是。

2024-01-27 18:55:24 742

原创 强化学习基础(一)

有一个拥有K根拉杆的老虎机,拉动每一根拉杆都对应一个关于奖励的概率分布R。我们每次拉动其中一根拉杆,就可以从该拉杆对应的奖励概率分布中获得一个奖励r。我们在各根拉杆的奖励概率分布未知的情况下,从头开始尝试,目标是在操作T次拉杆后获得尽可能高的累积奖励。由于奖励的概率分布是未知的,因此我们需要在“探索拉杆的获奖概率”和“根据经验选择获奖最多的拉杆”中进行权衡。“采用怎样的操作策略才能使获得的累积奖励最高”便是多臂老虎机问题。探索与利用是与环境做交互学习的重要问题,是强化学习试错法中的必备技术。

2024-01-26 21:03:43 591 1

原创 vscode配置c/c++

vscode的下载就不多说了。

2024-01-25 20:27:56 521

原创 BN(Batch Normalization)

在神经网络的训练过程中, 我们一般会将输入样本的特征进行标准化处理,使数据变成均值为0, 标准差为1的高斯分布, 或者范围在0附近的分布。因为如果数据没有进行该处理的话, 由于样本特征分布比较散, 可能会导致学习速度慢甚至难以学习。因此一个较好的数据分布可以使神经网络的训练速度加快, 甚至效果更好。在模型训练的时候, 由于模型参数在发生更新, 那么除了输入层的数据之外, 后面网络的每一层的输入数据分布都是一直在发生变化的。

2024-01-25 13:15:25 839

原创 池化理解,还有卷积神经网络中最后一层为全连接层的原因

下述只是个人笔记,仅供参考。

2024-01-24 14:16:47 664 1

原创 几种激活函数详解

缺点类似于sigmoid函数。

2024-01-24 14:03:17 458 1

原创 CNN卷积理解

卷积层使用一组可学习的过滤器来扫描输入数据(通常是图像)。每个过滤器都是一个小的窗口,包含一些权重,这些权重通过训练数据进行学习。过滤器的大小(例如3x3或5x5)决定了它观察输入数据的范围大小。较小的过滤器可以捕捉到细粒度的特征,而较大的过滤器可以捕捉到更大范围的特征。当过滤器在输入数据上滑动(或卷积)时,它会计算过滤器与输入数据的局部区域之间的点乘积,生成特征图。每个特征图代表了过滤器检测到的特定类型的特征在输入数据中的位置。

2024-01-24 13:52:35 564 2

原创 输入数据预处理(去均值,标准化,归一化)

1 去均值1 输入数据单位不一样, 可能会导致神经网络收敛速度慢, 训练时间长2 数据范围大的输入在模式分类中的作用可能偏大, 而数据范围小的作用就有可能偏小3 由于神经网络中存在的激活函数是有值域限制的, 因此需要将网络训练的目标数据映射到激活函数的值域4 S形激活函数在(-4,4)区间以外区域很平缓, 区分度太小。例如S形函数f(X), f(100) 与f(5)只相差0.00671 去均值。

2024-01-24 13:32:49 421 1

原创 R-FCN

1 Fast R-CNN网络中引入RoI Pooling的主要目的是因为网络中存在全连接层,所以需要通过特定的池化操作将不同尺度的proposal转换为相同维度的特征属性。2 在ResNet、GoogleNet等分类网络中,会将全连接转换为全卷积,也就是存在全卷积化的趋势。3 NOTE: 如果简单的在目标检测网络中也使用全卷积网络来代替全连接网络,检测效果会很差(会丢失全连接的融合特征和特征映射功能)。1.2 位置不变性和位置可变性1 位置不变性(Location Invariance)

2024-01-23 23:41:22 890 1

原创 pytorch安装(CPU和GPU),以及简单的API

1 END-TO-END MACHINE LEARNING FRAMEWORK(端到端的机器学习框架)上述这样命名就是因为深度学习只是机器学习的一个分支2 pytorch的优点:简单易用、分布式训练、服务器部署方便、移动端部署方便;3 PyTorch 是基于以下两个目的而打造的python科学计算框架:无缝替换NumPy,并且通过利用GPU的算力来实现神经网络的加速。通过自动微分机制,来让神经网络的实现变得更加容易。4 参考网站:5深度学习案例直观理解。

2024-01-23 15:13:51 1650 1

原创 BP神经网络

1 例子神经网络的一种求解W的算法,分为信号“正向传播(FP)”求损失,“反向传播(BP)”回传误差;根据误差值修改每层的权重,继续迭代1 例子具体原理就不多赘述,直接上例子好理解一些1.1 给定具体网络和参数下面给定了一个简单的全连接神经网络及其参数w和b。

2024-01-23 13:41:30 327 1

原创 激活函数理解

激活函数的主要作用是提供网络的非线性建模能力。如果没有激活函数,那么该网络仅能够表达线性映射,此时即便有再多的隐藏层,其整个网络跟单层神经网络也是等价的。因此也可以认为,只有加入了激活函数之后,深度神经网络才具备了分层的非线性映射学习能力。激活函数的主要特性是:可微性(可导)、单调性(参考)、输出值的范围可控(参考); 常见的激活函数:Sign函数、Sigmoid函数、Tanh函数、ReLU函数、P-ReLU函数、Leaky-ReLU函数、ELU函数、Maxout函数等

2024-01-23 13:03:01 381 1

原创 Faster R-CNN

RPN实际上是Faster R-CNN中的一个小的神经网络,通过这个网络来生成候选区域框ROI;集成)网络:2 使用网络取代模块3 候选框生成网络RPN和检测网络Fast R-CNN4 Region proposals量少质优(~300)利用NMS去除低质量的候选框高precision、高recall。

2024-01-21 23:19:31 1891 1

原创 C语言(个人笔记,之前学过,现在复习一遍,把忘了的或者没学到的记录下来,持续更新)

定义变量的时候一定要给初始值例如 int age;这样不行,要int age = 0;如果没有值给,可以初始值为0scanf在c中是一个输入函数,在控制台输入值,与printf是一对直接使用scanf会报错如下它提示,使用scanf不安全,让使用scanf_s,不用管他,直接在首行加上他给的提示信息,加上#define_CRT_SECURE_NO_WARNINGS这样就可以运行了小知识:所以说,你可以在里面改内容,每次创建都会自带你改的内容。

2024-01-19 19:46:06 926 1

原创 对RCNN中回归器偏移参数的一些理解,之前理解的有点问题,对训练和测试搞得有点糊涂了

在回归器中,都是训练偏移参数,也就是候选区域到真实区域的偏移。偏移是四个值的偏移,中心点坐标x, y ,还有宽和高 w, h也就是候选区域的这四个值 通过四个偏移量 偏移到真实区域的四个值。

2024-01-18 21:47:13 379 1

原创 Fast R-CNN

Fast R-CNN是在R-CNN的基础上融入了SPP Net网络优点之后的一个改进网络,相比于R-CNN和SPP Net具有以下优点:1 训练/预测运行速度更快;2 mAP效果评估指标更高;3 实现端到端()的模型训练;(多任务损失函数(Multi-task loss))4 所有层的参数都可以fine tune重训练;5 不需要离线存储特征文件;7 使用Softmax替换SVM分类器;

2024-01-18 18:26:19 874 1

原创 空间金字塔和图像金字塔

在实际应用中,图像金字塔可以用来增强模型对不同大小目标的检测能力,而空间金字塔池化可以用来确保模型能够有效处理各种大小的输入图像。虽然它们的目的相似——都是处理多尺度的问题——但具体的实现和应用场景有所不同。空间金字塔和图像金字塔这两个概念容易混淆,但它们各自在计算机视觉中有不同的用途和意义。

2024-01-18 11:05:46 348 1

原创 SPP-net

在上图RCNN中,因为要使提取区域的尺寸固定,使用resize会导致图像失真在SPP-net中,则不会固定尺寸,选择性搜索(Selective Search)算法首先在原始图像上运行,以生成大约 2000 个区域提案,整张图像经过卷积后,这些提案在原始图像中对应的区域在经过卷积层处理后,在特征图上也有相应的映射。然后经过SPP层处理空间金字塔池化层(SPP层)的目的是从每个区域提案中提取一个固定长度的特征向量,无论提案的尺寸如何。它通过在多个尺度(或称为级别)上进行池化操作来实现这一点。1x1。

2024-01-17 20:15:56 824

原创 R-CNN

CVPR2014经典paper:《Rich feature hierarchies for accurate object这篇论文的算法思想被称为R- CNN(Regions with Convolutional Neural Network Features)该算法思想更改了物体检测的总思路,现在很多物体检测算法均基于该算法。Region Proposals 是指可能包含目标对象的图像区域的候选集合。换句话说,它们是图像中那些可能包含我们想要检测的对象的区域。

2024-01-17 16:25:19 907

原创 DropBlock

图像具有空间局部依赖,在局部范围内,少量的像素特征值被drop掉,并不太影响整个模型的预测示例图。

2024-01-16 22:30:21 947

原创 萌新小白自己写的银行排队系统,感觉有用可自取

.基本功能(1)设立三个窗口进行取票服务(2)普通用户排队①会显示当前窗口等待人员(显示所有窗口和窗口等待的号码及其位次)②选择窗口预约取号并等待返回主界面(考虑到每个服务都有时间.一般取号后都会返回到主界面等待服务时间 我选择了排在队头的客户可以自主选择结束)(3)vip用户通道直接插队,选择窗口后排在窗口第一位优先处理(4)显示当前窗口等待人员显示当前窗口等待人员(显示所有窗口和窗口等待的号码及其位次)(对于课设要求是客户需要知道自己当前的号码 设计的是在进入排队

2021-06-18 10:45:38 611 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除