深度学习与计算机视觉
文章平均质量分 94
计算机视觉方面的内容
最白の白菜
Java道路长漫漫,坚持学习最关键。
人生苦短,我用Python。
人外有人,山外有山。越努力,越幸运!
展开
-
Jupyter Notebook与Pycharm代码连接Docker容器中的远程服务器运行
本篇文章分成三部分:MobaXterm 简单介绍与使用、Docker容器中安装Anaconda、CUDA与Pyorch、配置Pycharm以及Jupyter连接远程服务器。原创 2022-09-13 22:35:20 · 2468 阅读 · 3 评论 -
实例分割:Mask RCNN
Mask RCNN学习目标说明Mask RCNN的结构特点掌握Mask RCNN的RoIAlign方法掌握Mask RCNN的mask原理知道Mask RCNN的损失函数上图是MaskRCNN预测的结果Mask RCNN流程Mask-RCNN是一个实例分割(Instance segmentation)网络框架,通过增加不同的分支可以完成目标分类,目标检测,实例分割等多种任务。具体来讲,就是在Faster-RCNN的基础上增加了一个分支,在实现目标检测的同时分割目标像素,其分支结构如下图原创 2022-03-06 16:06:50 · 4577 阅读 · 0 评论 -
UNet案例
UNet案例学习目标了解宠物图像分割数据集能够完成UNet网络的搭建能够完成UNet网络的训练与预测任务及数据集简介使Oxford-IIIT Pet Dataset宠物图像分割数据集,包含37种宠物类别,其中有12种猫的类别和25种狗的类别,每个类别大约有200张图片,所有图像都具有品种,头部ROI和像素级分割的标注,如下图所示:图像分割时共分为前景,背景和不确定3种,图像数据包含的类别及对应的数量如下图所示: 数据集的目录结果如下所示:\segdata1、Images:存储数原创 2022-03-06 15:02:37 · 2542 阅读 · 3 评论 -
语义分割:FCN和UNet
目录语义分割:FCN和UNetFCN网络网络结构全卷积部分上采样部分跳层连接FCN总结Unet网络总结语义分割:FCN和UNet学习目标了解FCN的结构了解FCN的上采样方法及跳层连接掌握Unet网络结构FCN网络FCN(Fully Convolutional Networks) 用于图像语义分割,自从该网络提出后,就成为语义分割的基本框架,后续算法基本都是在该网络框架中改进而来。对于一般的分类CNN网络,如VGG和Resnet,都会在网络的最后加入一些全连接层,经过softmax后就原创 2022-03-06 09:44:28 · 1972 阅读 · 0 评论 -
目标分割概述
目录目标分割介绍图像分割的定义任务类型任务描述任务类型常用的开源数据集VOC数据集城市风光Cityscapes数据集评价指标像素精度平均像素精度平均交并比总结目标分割介绍学习目标知道图像分割的目的知道图像分割的任务类型知道图像分割的常见数据集知道图像分割的评估方法计算机视觉旨在识别和理解图像中的内容,包含三大基本任务:图像分类(图a)、目标检测(图b)和图像分割,其中图像分割又可分为:语义分割(图c)和实例分割(图d)。这三个任务对图像的理解逐步深入。假设给定一张输入图像,图像分类原创 2022-03-06 09:05:08 · 3649 阅读 · 0 评论 -
目标检测作业及阶段总结
目标检测作业及阶段总结01.NMS作业问题描述解答第一问解答# 加载盘from google.colab import drivedrive.mount('/content/drive/')# 指定当前的工作文件夹import os# 此处为google drive中的文件路径,drive为之前指定的工作根目录,要加上os.chdir("/content/drive/My Drive/Colab/Notebooks/") 注:代码是在Colab中运行的,如果是本机运行,以上代码原创 2022-03-04 19:19:28 · 2871 阅读 · 0 评论 -
SSD算法
目录SSD算法SSD网络结构backboneextra部分loc和clsPriorBox层先验框的生成方法loc的预测结果模型训练正负样本标记损失函数困难样本挖掘模型预测总结SSD算法学习目标知道SSD的多尺度特征图的网络知道SSD中先验框的生成方式知道SSD的损失函数的设计目标检测算法主要分为两类:Two-stage方法:如R-CNN系列算法,主要思路就是通过Selective Search或者CNN网络产生一系列的稀疏矩阵的候选区域,然后对这些候选区域进行分类和回归,two-stag原创 2022-03-04 16:15:52 · 2659 阅读 · 0 评论 -
YoloV3 案例
YoloV3 案例学习目标熟悉TFRecord文件的使用方法知道YoloV3模型结构及构建方法知道数据处理方法能够利用yoloV3模型进行训练和预测数据获取根据要实现的业务场景,需要收集大量的图像数据,一般来说包含两大来源,一部分是网络数据,可以是开源数据,也可以通过百度、Google图片爬虫得到,另一部分是用户场景的视频录像,这一部分的数据量会更大。对于开源数据我们不需要进行标注,而爬取的数据和视频录像需要进行标注,这时我们可以使用开源工具labelImg进行标注,该软件截图如下:原创 2022-03-04 11:45:15 · 2789 阅读 · 0 评论 -
YOLO系列算法
目录YOLO系列算法yolo算法Yolo算法思想Yolo的网络结构网络输入网络输出7X7网格30维向量Yolo模型的训练训练样本的构建损失函数模型训练模型预测yolo总结yoloV2预测更准确(better)batch normalization使用高分辨率图像微调分类模型采用Anchor Boxes聚类提取anchor尺度边框位置的预测细粒度特征融合多尺度训练速度更快(Faster)识别对象更多yoloV3算法简介多尺度检测网络模型结构先验框logistic回归yoloV3模型的输入与输出yoloV4总结原创 2022-03-03 11:09:57 · 27876 阅读 · 1 评论 -
Faster-RCNN网络
Faster-RCNN网络学习目标熟悉FasterRCNN目标检测的思想知道anchor(锚框)的思想掌握RPN网络是如何进行候选区域的生成的掌握ROIPooling的使用方法知道fasterRCNN的训练方法在R-CNN和Fast RCNN的基础上,在2016年提出了Faster RCNN网络模型,在结构上,Faster RCNN已经将候选区域的生成,特征提取,目标分类及目标框的回归都整合在了一个网络中,综合性能有较大提高,在检测速度方面尤为明显。接下来我们给大家详细介绍fasterR原创 2022-03-02 17:43:15 · 3569 阅读 · 7 评论 -
R-CNN网络基础
目录R-CNN网络基础Overfeat模型RCNN模型算法流程候选区域生成CNN网络提取特征目标分类(SVM)目标定位预测过程算法总结Fast RCNN模型算法流程ROI Pooling目标分类和回归模型训练模型预测模型总结总结R-CNN网络基础学习目标了解Overfeat模型的移动窗口方法了解RCNN目标检测的思想了解fastRCNN目标检测的思想知道多任务损失Overfeat模型Overfeat方法使用滑动窗口进行目标检测,也就是使用滑动窗口和神经网络来检测目标。滑动窗口使用固定宽原创 2022-02-28 17:38:23 · 1260 阅读 · 0 评论 -
目标检测概述
目录目标检测概述目标检测常用的开源数据集PASCAL VOC数据集MS COCO数据集常用的评价指标IOUmAP(*Mean Average Precision*)NMS(非极大值抑制)目标检测方法分类总结目标检测概述学习目标了解目标检测的任务知道目标检测的常用数据集知道目标检测算法的评价指标掌握非极大值NMS算法的应用了解常用的目标检测算法分类目标检测目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标,并确定它们的类别和位置。目标检测中能检测出来的物体原创 2022-02-28 11:11:46 · 2886 阅读 · 0 评论 -
深度学习及图像分类阶段作业与阶段总结
这目录深度学习及图像分类阶段作业与阶段总结深度学习作业问题1:神经网络构建问题1代码用function API构建通过sequential的方式进行构建通过model的子类构建问题2:特征图大小计算问题2答案问题3:特征图计算问题3答案:图像分类作业问题:ResNet34代码模型构建利用fashionmnist数据对网络进行训练数据读取模型编译模型训练模型评估**遇到问题:tensorflow 里面fashion_mnist下载失败(超时)的问题**阶段总结深度学习及图像分类阶段作业与阶段总结深度学习作原创 2022-02-27 17:50:10 · 1239 阅读 · 0 评论 -
图像增强与模型微调学习随笔
目录图像增强与模型微调学习随笔常用的图像增强方法tf.image进行图像增强翻转和裁剪颜色变换使用ImageDataGenerator()进行图像增强模型微调微调热狗识别获取数据集模型构建与训练总结图像增强与模型微调学习随笔图像增强学习目标知道图像增强的常用方法能够利用tf.keras来完成图像增强大规模数据集是成功应用深度神经网络的前提。例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的原创 2022-02-23 18:41:35 · 898 阅读 · 2 评论 -
经典的图像分类模型
目录经典的图像分类模型AlexNetAlexNet的网络架构手写数字势识别数据读取模型编译模型训练模型评估VGGVGG的网络架构手写数字势识别数据读取模型编译模型训练模型评估GoogLeNetInception 块GoogLeNet模型B1模块B2模块B3模块B4模块B5模块手写数字识别数据读取模型编译模型训练模型评估延伸版本InceptionV2InceptionV3ResNet残差块ResNet模型手写数字势识别数据读取模型编译模型训练模型评估经典的图像分类模型AlexNet学习目标知道Ale原创 2022-02-22 19:19:58 · 4636 阅读 · 2 评论 -
图像分类入门
图像分类入门学习目标知道图像分类的目的知道imageNet数据集图像分类图像分类实质上就是从给定的类别集合中为图像分配对应标签的任务。也就是说我们的任务是分析一个输入图像并返回一个该图像类别的标签。假定类别集为categories = {dog, cat, panda},之后我们提供一张图片给分类模型,如下图所示:分类模型给图像分配多个标签,每个标签的概率值不同,如dog:95%,cat:4%,panda:1%,根据概率值的大小将该图片分类为dog,那就完成了图像分类的任务。常用数据集原创 2022-02-21 13:22:17 · 2982 阅读 · 0 评论 -
卷积神经网络(CNN)
目录卷积神经网络(CNN)CNN网络的构成卷积层卷积的计算方法padding(填充)stride(步长)多通道卷积多卷积核卷积特征图大小池化层(Pooling)最大池化平均池化全连接层卷积神经网络的构建数据加载数据处理模型搭建模型编译模型训练模型评估总结卷积神经网络(CNN)学习目标了解卷积神经网络的构成知道卷积的原理以及计算过程了解池化的作用以及计算过程利用全连接神经网络对图像进行处理存在以下两个问题:需要处理的数据量大,效率低假如我们处理一张 1000×1000 像素的图片,参原创 2022-02-20 18:36:10 · 2736 阅读 · 0 评论 -
神经网络案例
目录神经网络案例数据加载数据处理模型构建模型编译模型训练模型测试模型保存总结神经网络案例学习目标能够利用tf.keras获取数据集能够网络多层神经网络的构建能够完成网络的训练和评估使用手写数字的MNIST数据集如上图所示,该数据集包含60,000个用于训练的样本和10,000个用于测试的样本,图像是固定大小(28x28像素),其值为0到255。整个案例的实现流程是:数据加载数据处理模型构建模型训练模型测试模型保存首先要导入所需的工具包:# 导入相应的工具包impor原创 2022-02-20 13:50:07 · 3942 阅读 · 0 评论 -
深度学习的正则化
目录深度学习的正则化L1与L2正则化Dropout正则化提前停止批标准化总结深度学习的正则化学习目标知道L2正则化与L1正则化的方法知道随机失活droupout的应用知道提前停止的使用方法知道BN层的使用方法在设计机器学习算法时不仅要求在训练集上误差小,而且希望在新样本上的泛化能力强。许多机器学习算法都采用相关的策略来减小测试误差,这些策略被统称为正则化。因为神经网络的强大的表示能力经常遇到过拟合,所以需要使用不同形式的正则化策略。正则化通过对算法的修改来减少泛化误差,目前在深度学习中原创 2022-02-20 12:35:00 · 3203 阅读 · 0 评论 -
深度学习的优化方法
优化方法深度学习的优化方法梯度下降算法反向传播算法(BP算法)前向传播与反向传播链式法则反向传播算法梯度下降优化方法动量算法(Momentum)指数加权平均动量梯度下降算法AdaGradRMSpropAdam学习率退火分段常数衰减指数衰减1/t衰减总结深度学习的优化方法学习目标知道梯度下降算法理解神经网络的链式法则掌握反向传播算法(BP算法)知道梯度下降算法的优化方法了解学习率退火梯度下降算法梯度下降法简单来说就是一种寻找使损失函数最小化的方法。大家在机器学习阶段已经学过该算法,所以原创 2022-02-19 15:46:44 · 2593 阅读 · 0 评论 -
常见的损失函数学习随笔
常见的损失函数学习随笔学习目标知道分类任务的损失函数知道回归任务的损失函数在深度学习中, 损失函数是用来衡量模型参数的质量的函数, 衡量的方式是比较网络输出和真实输出的差异,损失函数在不同的文献中名称是不一样的,主要有以下几种命名方式:分类任务在深度学习的分类任务中使用最多的是交叉熵损失函数,所以在这里我们着重介绍这种损失函数。多分类任务在多分类任务通常使用softmax将logits转换为概率的形式,所以多分类的交叉熵损失也叫做softmax损失,它的计算方法是:其中,y是样本原创 2022-02-17 17:32:26 · 870 阅读 · 0 评论 -
神经网络学习随笔
神经网络神经网络简介深度学习简介神经网络介绍神经元是如何工作的激活函数Sigmoid/logistics函数:tanh(双曲正切曲线)RELULeakReLuSoftMax其他激活函数如何选择激活函数隐藏层输出层参数初始化随机初始化标准初始化Xavier初始化He初始化神经网络的搭建通过Sequential构建利用function API构建通过model的子类构建神经网络的优缺点优点缺点总结神经网络简介深度学习简介学习目标知道深度学习与机器学习的关系知道神经网络是什么知道常见的激活函数知道原创 2022-02-17 16:10:42 · 603 阅读 · 2 评论 -
Tensorflow入门
文章目录Tensorflow入门tensorflow和keras简介TensorFlow介绍TensorFlow的安装张量及其操作tf.keras介绍总结快速入门模型相关的库的导入数据展示和划分sklearn实现tf.keras实现总结Tensorflow入门tensorflow和keras简介学习目标了解Tensorflow2.0框架的用途及流程知道tf2.0的张量及其操作知道tf.keras中的相关模块及常用方法TensorFlow介绍深度学习框架TensorFlow一经发布,就受到原创 2022-02-11 16:05:43 · 1066 阅读 · 0 评论 -
深度学习与计算机视觉(CV)介绍
深度学习与计算机视觉(CV)介绍深度学习学习⽬标知道什么是深度学习知道深度学习的应⽤场景什么是深度学习在介绍深度学习之前,我们先看下⼈⼯智能,机器学习和深度学习之间的关系:机器学习是实现⼈⼯智能的⼀种途径,深度学习是机器学习的⼀个⼦集,也就是说深度学习是实现机器学习的⼀种⽅法。与机器学习算法的主要区别如下图所示:传统机器学习算术依赖人工设计特征,并进行特征提取,而深度学习方法不需要人工,而是依赖算法自动提取特征。深度学习模仿人类大脑的运行方式,从经验中学习获取知识。这也是深度学习被原创 2022-02-10 15:26:10 · 8098 阅读 · 0 评论