深度学习
文章平均质量分 76
关于深度学习神经网络的一些知识
猛男技术控
苦心钻研!
勇于实践!
不负韶华!
展开
-
YOLOv3论文精读: An Incremental Improvement-增量式的改进
我们对 YOLO 进行了一系列更新!它包含一堆小设计,可以使系统的性能得到更新。我们也训练了一个新的、比较大的神经网络。虽然比上一版更大一些,但是精度也提高了。不用担心,它的速度依然很快。YOLOv3 在 320×320 输入图像上运行时只需 22ms,并能达到 28.2 mAP,其精度和 SSD 相当,但速度要快上 3 倍。使用之前 0.5 IOU mAP 的检测指标,YOLOv3 的效果是相当不错。原创 2023-01-13 08:00:00 · 892 阅读 · 0 评论 -
yolov5修改骨干网络-使用自己搭建的网络-以efficientnetv2为例
efficientnet则是通过NAS搜索,同时增加width、depth以及resolution,使网络结构达到最优。下表为EfficientNet-B0的网络框架(B1-B7就是在B0的基础上修改Resolution,Channels以及Layers),可以看出网络总共分成了9个Stage。第一个Stage是一个卷积核大小为3x3,stride为2的普通卷积层(包含BN和Swish激活函数);原创 2022-12-15 15:39:48 · 5883 阅读 · 15 评论 -
yolov5修改骨干网络--原网络说明
以yolov5s为例(模型都是在yolov5l上修改了depth_multiple和width_multiple,上面图形是画的yolov5l的,下面的yaml是yolov5s的目的是为了更好的计算网络信息)进入模型搭建的,传入参数:cfg就是我们yaml文件中定义的网络,ch表示输入是彩色图,nc是num classes,anchors就是anchors。下面看具体怎么搭建的。我认为yolo的核心代码就是parse_model函数,简小精悍(当然最主要的还是Conv,C3,Bottleneck这些函数)原创 2022-12-14 16:18:26 · 2319 阅读 · 2 评论 -
yolov1 论文理解 - You Only Look Once-Unified, Real-Time Object Detection-统一的实时目标检测
这是yolov1的模型,他将图像划分成了7x7个网格,每个网格负责预测两个边界框,每个边界框都有5个信息$x、y、w、h、confidence $ ,(这个confidence是该区域有目标框的概率),共预测20个类,每个类都有一个置信度信息(这个confidence是这个框是猫是狗的概率),所以最终输出为。网格强化了边界框预测中的空间多样性。合适的阈值下可能只留下一个框,当然某些阈值下可能会保留更多的框,阈值的设置应该是根据目标任务设置的,越高的阈值(越不容易置零,即越宽容)会检测出越多的目标。原创 2022-12-05 21:41:47 · 762 阅读 · 0 评论 -
yolo后处理操作-如何获取我们想要的目标框及置信度?
yolo后处理就是模型的输出进行处理,得到我们想要的坐标框的xywhxywhxywh以及confidenceconfidenceconfidence学习笔记这是yolov1的模型,他将图像划分成了7x7个网格,每个网格负责预测两个边界框,每个边界框都有5个信息$x、y、w、h、confidence $ ,(这个confidence是该区域有目标框的概率),共预测20个类,每个类都有一个置信度信息(这个confidence是这个框是猫是狗的概率),所以最终输出为 7∗7∗307*7*307∗7∗30然后每原创 2022-12-05 14:15:00 · 2217 阅读 · 0 评论 -
对比学习-SimSiam-论文精读&解析
模型坍塌,在siamese中主要是输入数据经过卷积激活后收敛到同一个常数上,导致无论输入什么图像,输出结果都能相同。而He提出的simple Siamese networks在没有采用之前的避免模型坍塌那些方法:实验表明对于损失和结构确实存在坍塌解,但stop-gradient操作在防止坍塌方面起着至关重要的作用。如图为simsiam 的结构,输入是训练集中随机选取的一个图像,使用随机数据增强生成两个图像;左右两个encoder是完全一样的,包含卷积和全连接,将图像进行编码(特征提取);perdictor原创 2022-12-04 15:13:02 · 1993 阅读 · 0 评论 -
图像仿射变换与双线性插值
下面的所有变换假设都是针对一幅图像,即一个三维数组(HWC),这里为简单起见,假设图像都是单通道(C=1)的。若将原图像沿 x和 y方向分别平移δx和δy,即:x′=x+δxy′=x+δyx′=x+δx\\y′=x+δyx′=x+δxy′=x+δy写成矩阵形式如下:假设将图像分别沿 x和 y方向分别缩放 p倍和 q倍,且 p>0,q>0,即:x′=pxy′=qyx′=px\\y′=qyx′=pxy′=qy写成矩阵形式如下: 图 1. 旋转变换示意图如上图所示,点 A旋转θ角到点 B,由 B点可原创 2022-12-04 15:00:41 · 561 阅读 · 0 评论 -
空间变形网络——STN
CNN 的机理使得 CNN 在处理图像时可以做到 transition invariant,却没法做到 scaling invariant 和 rotation invariant。即使是现在火热的 transformer 搭建的图像模型 (swin transformer, vision transformer),也没办法做到这两点。(注:spatial transformer和这两个transformer原理不一样,虽然都叫transformer)因为他们在处理时都会参考图像中物体的相对大小和位置方向。原创 2022-12-04 14:58:10 · 6131 阅读 · 0 评论 -
孪生神经网络
孪生神经网络(Siamese network)主要用途是比较两图片的相似程度,其核心思想就是权值共享。卷积神将网络是通过卷积运算提取图像的特征进行训练的,如果想比较两个图像的相似程度,也要对两个图像分别进行特征提取,只判断特征的相似度就可以了。然而不同的卷积核运算后得到的特征很有可能不在一个域中,所以要使用同一个网络进行特征提取。孪生神经网络的优点:对于类别不平衡问题鲁棒性更强,更易于做集成学习,可以从语义相似性上学习来估测两个输入的距离。孪生神经网络的缺点,由于有两个输入,两个子网,其训练相对于常规网络运原创 2022-12-04 14:55:33 · 2567 阅读 · 0 评论 -
YOLOV5、V7 训练格式转换-训练自己的数据集-猛男技术控
不用创建文件夹,只需把我代码中的图片和xml文件夹修改成自己的即可原创 2022-11-04 14:33:40 · 1180 阅读 · 1 评论 -
提取voc数据集中特定的类
先贴出代码:import shutilimport osimport xml.etree.ElementTree as ETAnnotations_path = r"E:/data/voc/VOCdevkit/VOC2007/Annotations"image_path = r"E:/data/voc/VOCdevkit/VOC2007/JPEGImages"save_img_path = r"E:/data/voc/VOCdevkit/VOC2007/tte/"save_xml_path原创 2021-04-13 12:31:38 · 1254 阅读 · 6 评论 -
labelimg标注工具使用
下载工具pip install labelimg 工具很小,下载很快这里也可以下载桌面版,直接打开就能用。工具使用一般我们会选择打开文件夹对改文件夹里的图片进行标注使用快捷键w可以选择框,然后进行标注,注意label是啥就写啥快捷键Ctrl + u加载目录中的所有图像,鼠标点击Open dir同功能Ctrl + r更改默认注释目标目录(xml文件保存的地址)Ctrl + s保存Ctrl + d复制当前标签和矩形框space将当前图像标记原创 2021-03-19 14:35:28 · 3080 阅读 · 2 评论 -
numpy实现全连接网络进行mnist训练测试
import numpy as npimport matplotlib.pyplot as pltfrom sklearn.utils import shufflefrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import minmax_scaleimport pickleimport structimport os"""定义几个要用到的函数"""def load_mnist原创 2021-03-08 20:40:17 · 634 阅读 · 1 评论 -
pytorch深度学习实战-四种天气图片数据分类
数据导入与处理import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimport torchvisionimport osimport shutilfrom torchvision import transforms数据为1原创 2021-02-24 18:12:21 · 3933 阅读 · 14 评论 -
pytorch实战案例-手写数字分类-卷积模型——深度AI科普团队
数据准备导入需要的模块import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimimport numpy as npimport matplotlib.pyplot as pltimport torchvisionfrom torchvision import datasets, transforms%matplotlib inlinetorch.nn为我们提供原创 2021-02-18 14:18:36 · 352 阅读 · 0 评论 -
pytorch实战案例-手写数字分类-全链接模型——深度AI科普团队
数据准备导入需要的模块import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimimport numpy as npimport matplotlib.pyplot as pltimport torchvisionfrom torchvision import datasets, transforms%matplotlib inlinetorch.nn为我们提供原创 2021-02-18 11:38:03 · 472 阅读 · 1 评论 -
labelme进行mask图像标注
安装labelmecmd里输入以下代码,pip install labelme-i https://pypi.tuna.tsinghua.edu.cn/simple用清华源非常快打开labelmecmd里直接输入labelme 就会自己打开我们常用的标注方式就这两种,多边形和矩形打开我们保存的文件地址,看到对应的json文件就说明保存成功了。具体json文件怎么转换之后再说。...原创 2021-02-06 18:22:05 · 2173 阅读 · 2 评论 -
人工智能数学基础-python数值计算实战
求极限求下列极限并用python编程求极限。求解:2. 求导求的导数并用python编程求导。求偏导已知 求在点(1,2)处的偏导数,并用python编程实现。(提示:复合函数求导,设、、求偏导带入求值方向导数及梯度求定积分p = 8n = 10000sum1 = 0 for i in range(1,n+1): sum1 += i**pprint(sum1/n**(p+1))...原创 2021-01-19 13:24:34 · 443 阅读 · 0 评论 -
动手学pytorch之通俗易懂何为卷积-深度AI科普团队
什么是卷积卷积神经网络是机器视觉,乃至整个深度学习的核心。首先看为什么卷积这么厉害。我们所有的图片,如灰度图,每一个像素点都有一个灰度值,构成一个矩阵。设长宽为28像素,则该矩阵大小为2828对于彩色图片也一样,他是由rbg三种颜色构成,我们看成三张像素图,也就是三个灰度图的矩阵就行了(其实为一张,一个矩阵,其大小为2828*3)。...原创 2021-01-18 10:37:04 · 356 阅读 · 1 评论 -
物体检测评价指标
IOU对于一个检测器,我们需要制定一定的规则来评价其好坏,从而选择需要的检测器。对于图像分类任务来讲,由于其输出是很简单的图像类别,因此很容易通过判断分类正确的图像数量来进行衡量。物体检测模型的输出是非结构化的,事先并无法得知输出物体的数量、位置、大小等,因此物体检测的评价算法就稍微复杂一些。对于具体的某个物体来讲,我们可以从预测框与真实框的贴合程度来判断检测的质量,通常使用loU (Intersection of Union)来量化贴合程度。loU的计算方式如图所示,使用两个边框的交集与并集的比值,原创 2021-01-15 14:19:09 · 1223 阅读 · 1 评论 -
pytorch入门-简介及安装
pytorch简介pytorch特点pytorch安装miniconda和anaconda差不多,mini比较小而已修改用户文件,在C盘用户里,找到你的用户,用记事本打开就行,将下面代码复制进去。channels: - defaultsshow_channel_urls:truedefault_channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkqs/main - https://mirro原创 2021-01-09 11:42:01 · 446 阅读 · 0 评论 -
梯度下降法-深度AI
文章目录概述概念理解场景假设数学场景梯度官方解释:通俗理解梯度求解目标函数损失函数实战演示求一元最值寻找最低点更新x代码实现:求多元最值求一元函数的参数概述梯度下降法,是一种基于搜索的最优化方法,它其实不是一个机器学习算法,但是在机器学习领域,许多算法都是以梯度下降法为基础的,不论是在线性回归还是Logistic回归还是其他深度学习算法中,它的主要作用就是通过迭代寻找目标函数的最优解。常用的梯度下降法有 3 种不同的形式:批量梯度下降法,简称 BGD,使用所有样本,比较耗时;随机梯度下降.原创 2021-01-14 18:56:23 · 228 阅读 · 0 评论 -
深度学习之图像识别基础篇——神经元与感知机
本系列文章是自己学了一段时间深度学习并且做出一定东西后再回头打数学理论基础而写,旨在巩固自己的基础,帮助小白快速入门。这都是自己弄懂之后才写的,完全弄懂那些数学公式也是比较难的,希望看这篇文章的小伙伴一定要看懂下面的代码。有不懂得可以直接提出,若有错误,当立即改正,若不有侵权,当立即删除。原创 2020-08-29 12:58:38 · 2580 阅读 · 0 评论 -
写给萌新们的Python安装及环境配置(anaconda,pycharm,GPU)教程
系列文章目录文章目录系列文章目录前言Anaconda简介python是什么问啥要用anaconda二、anaconda下载安装配置TensorFlow-gpu环境Pycharm使用conda环境2.读入数据总结前言由于种种原因,好久没更博客了,感觉现在访问量下了一个等级????。最近电脑突然连不上网了,尝试里好多方法,都不行,最后直接尝试了最有效、最万能到方法——重装系统。当然之前的深度学习环境也没了,正好由于实验室要纳新了,环境搭建是开始代码到第一步,所以重新配置环境的同时写一篇深度学习环境搭原创 2020-10-03 12:44:20 · 2595 阅读 · 0 评论 -
图像分割总体介绍——深度AI科普团队
概览初识图像分割顾名思义,图像分割就是指将图像分割成多个部分。在这个过程中,图像的每个像素点都和目标的种类相关联。图像分割方法主要可分为两种类型:语义分割和实例分割。语义分割会使用相同的类标签标注同一类目标(下图左),而在实例分割中,相似的目标也会使用不同标签进行标注(下图右)。图像分割模型的基本架构包括编码器与解码器。编码器通过卷积核提取图像特征。解码器负责输出包含物体轮廓的分割蒙版。分割类别图像分割(image segmentation):根据某些规则将图片分成若干个特定的、具有独特性质的原创 2020-08-11 12:09:25 · 6197 阅读 · 12 评论 -
基于Keras的YOLOv4目标检测平台
前言首先说一下什么是目标检测:对计算机而言,能够“看到”的是图像被编码之后的数字,但它很难解高层语义概念,比如图像或者视频帧中出现目标的是人还是物体,更无法定位目标出现在图像中哪个区域。目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别,并在该目标周围绘制边界框,标示出每个目标的位置。如图所示:(a)是图像分类任务,只需识别出这是一张斑马的图片。(b)是目标检测任务,不仅要识别出这是一张斑马的图片,还要标出图中斑马的位置。目标检测发展历程在上一节中我们学习了图像分类处理原创 2020-08-11 10:49:36 · 8757 阅读 · 13 评论 -
从V1到V4,让你读懂YOLO原理——深度AI科普团队
YOLO系列是目前主流的目标检测算法,其 检测目标位置和对目标物体进行分类这两步同时进行,极大加快了其检测速度,这里我介绍了yolov1到yolov4的大体知识概述,让你初步了解其原理。代码及代码解读会在之后的博客中给出,原创 2020-08-02 12:05:01 · 13449 阅读 · 17 评论 -
小白学深度之LSTM长短期记忆神经网络——深度AI科普团队
前言不知道RNN的一定要先看看RNN的原理在RNN中我们说了RNN的不足,也就是对较长的时间,或者较长的string,很多时候前面的数据对后面的数据影响就很小甚至没影响了,这是我们就要加强前面的数据的权值;或者数据不是很长,但是最开始的数据对很往后的数据基本没啥影响,但RNN记住了,并对后面的数据产生了影响,这时我们就要往往要增大近期数据的权值。在本文中,我们将介绍一种改进之后的循环神经网络:长短时记忆网络(Long Short Term Memory Network, LSTM),它成功的解决了原始原创 2020-07-13 21:59:05 · 3659 阅读 · 31 评论 -
小白学深度之RNN循环神经网络
我本身也是个小白,近期在学这方面的内容,这篇博客可以说是一个知识的总结吧。站在小白视角看待RNN,我这么笨都能看明白,相信你们肯定也能明白。希望对大家有所帮助,不足之处还望指出。原创 2020-07-12 23:08:32 · 2358 阅读 · 38 评论 -
写给小白的自然语言处理入门简介
自然语言处理简介什么是自然语言自然语言是人类社会发展过程中自然产生的语言,是最能体现人类智慧和文明的产物。它是一种人与人交流的载体,我们使用语言传递知识。这个星球上许多生物都拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。自然语言是人类间交流传播信息知识的工具语言是思维的载体,是人类交流思想、表达情感最自然、最直接、最方便的工具,人类历史上以语言文字形式记载和流传的知识占知识总量的80%以上。视频里还有好多,想要的私聊我下吧,视频加ppt都给你。原创 2020-06-18 20:02:43 · 1674 阅读 · 22 评论 -
小白视角来看传说中的卷积神经网络
从小白的视角来看卷积神经网络笔记比较详细,但肯定也有很多地方写的不清楚或者不正确,还望指正如果你和我一样是小白,希望对你有所帮助原创 2020-05-14 17:10:56 · 2388 阅读 · 5 评论 -
你还在担心开车看不到路标吗?我这这有个路标分类的来玩玩啊(有源码有数据集)
你还在担心开车看不到路标吗?别看美女看路标我这有个路标检测分类的小项目日后成型后肯定可以帮你看清路标哦、(我知道开车不看美女就能看到路标,但我偏偏要放一个美女啊 嘿嘿????)快来玩玩啊。基于keras和tensorflow你还在找多分类项目吗?这有个交通标志分类的来玩玩啊里面附有源码和 有详细解释和数据地址当然不止这一个了,虽然现在东西很少,但我肯定会陆续上床的,肯定好玩有刺激嘿嘿相信小白不白nie日后肯定上千星欢迎starhttps://github.com/lizheng-1/原创 2020-05-08 23:59:13 · 662 阅读 · 11 评论 -
卷积神经网络的几种典型架构
imageNet lelNet-5 AlexNet VGGNet gooogleNet ResNet原创 2020-05-06 17:47:49 · 2411 阅读 · 11 评论 -
小白入坑人工智能——深度AI科普团队
1. 人工智能、机器学习与深度学习1.1 人工智能:努力将通常由人类完成的智力任务自动化。 因此,人工智能是一个综合性的领域,不仅包括机器学习与深度学习,还包括更多不涉及学习的方法。1.2 机器学习机器学习,人们输入的是数据和从这些数据中预期得到的答案,系统输出的是规则。这些规则随后可应用于新的数据,并使计算机自主生成答案。 机器学习:一种新的编程范式机器学习...原创 2020-04-23 23:38:58 · 1087 阅读 · 11 评论