![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 91
视觉一只白
学习深度学习与图像处理方面,有兴趣的可以一起交流。
展开
-
浅谈学习率与初始化对网络的影响
一、构建一个简单的神经网络神经网络的两个重要超参数W,和learning_rate的设置对网络的好坏有重要的影响,合理的设置超参数是很重要的,下面通过简单的实验来看看是怎么影响网络的。二、学习率的设置from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfimport matplotlib...原创 2017-12-17 21:52:50 · 4539 阅读 · 0 评论 -
YOLOv2
一、话说YOLO1.1 YOLOv1YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体。每个格子预测B个bounding box及其置信度(confidence score),以及C个类别概率。bbox信息(x,y,w,h)为物体的中心位置相对格子位置的偏移及宽度和高度,均被归一化.置信度反映是否包含物体以及包...原创 2018-05-05 19:23:55 · 768 阅读 · 0 评论 -
darknet的实现
一、下载与安装下载网络与权重文件:点击打开链接darkflow实现了将darknet翻译成tensorflow,可以用tensorflow加载darknet训练好的模型,并使用tensorflow重新训练,输出tensorflow graph模型,用于移动设备。dark flow需要安装的依赖库有numpy,tensorflow,opencv,python等。打开下载好的文件夹,里面有如下文件:在...原创 2018-05-05 21:13:11 · 2362 阅读 · 2 评论 -
常用损失函数小结
一、摘要本文主要总结一下常见的损失函数,包括:MSE均方误差损失函数、SVM合页损失函数、Cross Entropy交叉熵损失函数、目标检测中常用的Smooth L1损失函数。其中还会涉及到梯度消失、梯度爆炸等问题:ESM均方误差+Sigmoid激活函数会导致学习缓慢;Smooth L1损失是为了解决梯度爆炸问题。仅供参考。二、均方误差损失2.1 均方差损失函数的定义:均方差损失函数常用在最小二乘...转载 2018-05-27 11:01:58 · 81228 阅读 · 3 评论 -
Yolov1原理及实现
一、引言目前的检测系统通过重用分类器来执行检测。为了检测目标,这些系统为该目标提供一个分类器,在测试图像的不同的位置和不同的尺度上对其进行评估。像deformable parts models(DPM)这样的系统使用滑动窗口方法,其分类器在整个图像上均匀间隔的位置上运行。最近的方法,如R-CNN使用region proposal策略,首先在图像中生成潜在的边界框(bounding box),然后在...原创 2018-05-23 16:43:35 · 18909 阅读 · 19 评论 -
目标检测之SSD原理与实现
一、设计理念论文下载:点击打开链接SSD和Yolo一样都是采用一个CNN网络来进行检测,但是却采用了多尺度的特征图,其基本架构下图所示。下面将SSD核心设计理念总结为以下三点:1.采用多尺度特征图用于检测所谓多尺度采用大小不同的特征图,CNN网络一般前面的特征图比较大,后面会逐渐采用stride=2的卷积或者pool来降低特征图大小,这正如图3所示,一个比较大的特征图和一个比较小的特征图,它们都用...转载 2018-06-06 21:49:14 · 18516 阅读 · 8 评论 -
tensorflow的模型保存与恢复
一、模型保存与恢复1.模型保存saver = tf.train.Saver()2.模型恢复restore(self, sess, save_path)二、模型的训练此次用比较简单的卷积网络训练cifar10,实现图像的分类,今天的重点不在训练的网络结构上,模型的保存和恢复不仅可以保留上次的训练数据继续训练,还可以快速呈现之前的训练结果,话不多说下面上代码。import tensorflow as ...原创 2018-06-01 17:33:45 · 497 阅读 · 0 评论 -
随机森林
一、随机森林的定义 作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。如果接触过决策树(Decision Tree)的话,那么会很容易理解什么是随机森林。随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基...原创 2018-07-03 15:30:10 · 1211 阅读 · 0 评论 -
深度学习之Numpy
一、简介NumPy是Python中科学计算的基础软件包。它是一个提供多了维数组对象,多种派生对象(如:掩码数组、矩阵)以及用于快速操作数组的函数及API,它包括数学、逻辑、数组形状变换、排序、选择、I/O 、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等等。NumPy包的核心是ndarray对象。它封装了python原生的同数据类型的n维数组,为了保证其性能优良,其中有许多操作都是代码...原创 2018-11-19 21:45:39 · 572 阅读 · 0 评论 -
图像分割之segnet
一、算法介绍SegNet网络结构如下图所示,Input为输入图片,Output为输出分割的图像,不同颜色代表不同的分类。语义分割的重要性就在于不仅告诉你图片中某个东西是什么,而且告知你他在图片的位置。我们可以看到是一个对称网络,由中间绿色pooling层与红色upsampling层作为分割,左边是卷积提取高维特征,并通过pooling使图片变小,SegNet作者称为Encoder,右边是反卷积...原创 2018-12-04 16:35:39 · 5601 阅读 · 9 评论 -
EAST自然场景文本检测的实现
一、概述最近,提取和理解自然场景中包含的文本信息变得越来越重要和受欢迎,ICDAR系列竞赛的前所未有的大量参与者和NIST推出的TRAIT 2016评估证明了这一点。文本检测作为后续过程的先决条件,在文本信息提取和理解的整个过程中起着至关重要的作用。以前文本检测方法已经在各种基准测试中获得了很好的表现这个领域。文本检测的核心是区分文本和背景的功能设计。传统上,功能是手动设计的在深度学习中捕获场...原创 2019-03-08 18:30:44 · 2435 阅读 · 0 评论 -
Keras 多输入和混合数据
一、简介这一节将学习如何定义能够接受多个输入的Keras架构,包括数字,分类和图像数据。 然后,我们将在此混合数据上训练单个端到端网络。二、从视觉和文本特征估算房价论文地址:House price estimation from visual and textual features数据集下载:Dataset大多数现有的自动房价估算系统仅依赖于一些文本数据,例如其邻近区域和房间...原创 2019-03-18 17:06:08 · 2777 阅读 · 3 评论 -
语义分割发展小结
一、话说语义分割语义分割方法在处理图像时,具体到像素级别,也就是说,该方法会将图像中每个像素分配到某个对象类别。下面是一个具体案例。左边为输入图像,右边为经过语义分割后的输出图像。该模型不仅要识别出摩托车和驾驶者,还要标出每个对象的边界。因此,与分类目的不同,相关模型要具有像素级的密集预测能力。目前用于语义分割研究的两个最重要数据集是VOC2012和MSCOCO。VOC2012:点击打开链接MSC...转载 2018-05-09 20:17:06 · 6948 阅读 · 1 评论 -
深度学习之图片风格转换
一、话说风格转换以目前的深度学习技术,如果给定两张图像,完全有能力让计算机识别出图像具体内容。而图像的风格是一种很抽象的东西,人眼能够很有效地的辨别出不同画家不同流派绘画的风格,而在计算机的眼中,本质上就是一些像素,多层网络的实质其实就是找出更复杂、更内在的特性(features),所以图像的风格理论上可以通过多层网络来提取图像里面可能含有的一些有意思的特征。 根据前面第一篇论文中提出...原创 2018-04-05 19:46:33 · 4997 阅读 · 3 评论 -
Numpy 入门 二
参考来源:点击打开链接本文主要分为以下几个部分:Numpy--数组域的数组 (Array from numerical ranges)Numpy--索引和分片 (Indexing & slicing)Numpy--高级索引 (Advanced indexing)Numpy--广播(Broadcasting)Numpy--数组上的迭代 (Iterating over array)Numpy-...原创 2018-04-12 10:33:26 · 248 阅读 · 0 评论 -
python爬取图片
一、必备小知识当需要自己做数据集时,最常用的方法就是从网页爬取图片来制作自己的数据集,今天就来简单的说说如何从百度图片爬取批量图片。当我们在看百度图片时,右键–检查–Elements,点击箭头,再用箭头点击图片时,会显示图片的位置和样式。但是,当我们右键查看网页源码时,出来的却是一大堆JavaScript代码,并没有图片的链接等信息。这是为什么呢?这是因为,百度图片的网页是一个动态页面,它的网页原...原创 2018-03-23 12:29:40 · 9573 阅读 · 5 评论 -
python制作自己的数据集
一、数据集介绍点击打开链接17_Category_Flower 是一个不同种类鲜花的图像数据,包含 17 不同种类的鲜花,每类 80 张该类鲜花的图片,鲜花种类是英国地区常见鲜花。下载数据后解压文件,然后将不同的花剪切到对应的文件夹,如下图所示:每个文件夹下面有80个图片文件。二、使用的工具首先是在tensorflow框架下,然后介绍一下用到的两个库,一个是os,一个是PIL。PIL(Python...原创 2018-03-20 17:12:14 · 43222 阅读 · 31 评论 -
简单的卷积神经网络
一、建立一个简单的卷积神经网络如上图所示,一个简单的卷积神经网络由卷积层,池化层,激活层,全连接层组成。设计一个好的卷积神经网络不是简单的事情,包括卷积核大小的选择,比如1,3,5,7等几个常用的大小,还有卷积核的个数的选择,比如1,2,4,16,32等等,还有就是全连接层的激活函数的选择等。下面我们就来简单看看卷积核个数和激活函数的选择。二、卷积核个数的选择from tensorflow.exa...原创 2017-12-17 19:59:05 · 1654 阅读 · 0 评论 -
tensorflow实现AlexNet
一、AlexNet构架的介绍AlexNet有5个卷积层和3个全连接层,发现移除任意一层都会降低最终的效果。网络结构如图:1. 基本结构a. 共有8层,其中前5层convolutional,后边3层full-connected,最后的一个full-connected层的output是具有1000个输出的softmax,最后的优化目标是最大化平均的multinomiallogistic regress...原创 2017-12-16 09:06:07 · 543 阅读 · 0 评论 -
Tensorflow中的优化器子类
tensorflow中包含几个优化算法,今天就具体看一下这些算法。GradientDescentOptimizer ,AdagradOptimizer ,MomentumOptimizer ,AdamOptimizer ,RMSPropOptimizer。1.GradientDescent梯度下降法是一种最优化问题求解的算法。有批量梯度和随机梯度两种不同的迭代思路。他们有以下的差异:批量梯度收敛速...原创 2017-12-14 20:59:22 · 676 阅读 · 0 评论 -
tensorflow实现线性分类之MNIST
一、MNIST数据集简介 MNIST 数据集可在 http://yann.lecun.com/exdb/mnist/ 获取, 它包含了四个部分: 1.Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本) 2.Training set labels: train...原创 2017-12-11 21:57:26 · 1088 阅读 · 0 评论 -
用Tensorflow实现简单的KNN
一、KNN算法的概念邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 简单来说,K-NN可以看成:有那么一堆你已经知道分类的数据,然后当一个新数据进入的时候,就开始跟训练数据 里的每个点求距离,然后挑离这个训练数据...原创 2017-12-08 11:19:39 · 2905 阅读 · 1 评论 -
综述|基于深度学习的目标检测
概述图像分类,检测及分割是计算机视觉领域的三大任务。图像分类模型(详情见这里)是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体(给出边界框)。目标检测在很多场景有用,如无人驾驶和安...转载 2018-03-22 11:27:33 · 1300 阅读 · 0 评论 -
从VGG到NASNet,一文概览图像分类网络
关键概念虽然计算机视觉研究者们采取的方法各不相同,但是大体而言,他们的实验设置有着如下的趋势。本文将讨论如何进行图像预处理,数据增强用于哪类数据,优化机制以及输出层的实现方法。预处理通常而言,我们会计算训练集图像的平均像素值,将其从图像中减去。请注意,在 keras 环境下使用这些模型时考虑预处理方法很重要。计算机视觉模型不同,Keras 的「预处理」也不同。数据增强图像分类的数据集非常大。尽管如...转载 2018-04-02 21:07:13 · 3859 阅读 · 0 评论 -
tensorflow常用函数
摘要:本文介绍了tensorflow的常用函数。1、tensorflow常用函数TensorFlow 将图形定义转换成分布式执行的操作, 以充分利用可用的计算资源(如 CPU 或 GPU。一般你不需要显式指定使用 CPU 还是 GPU, TensorFlow 能自动检测。如果检测到 GPU, TensorFlow 会尽可能地利用找到的第一个 GPU 来执行操作.并行计算能让代价大的算法计算加速执...转载 2018-04-11 16:33:31 · 220 阅读 · 0 评论 -
Numpy 入门 一
参考来源:点击打开链接本文主要分为以下几个部分:Numpy--简介 (Introduction)Numpy--Ndarray对象 (Ndarray object)Numpy--数据类型 (Data types)Numpy--数组属性 (Array attributes)Numpy--数组创建例程 (Array creation routines)Numpy--从现有数据创建数组 (Array fr...原创 2018-04-12 10:06:26 · 395 阅读 · 0 评论 -
文本检测数据集制作及xml转换为txt
一、标注工具rolabelImgrolabelImg和labelimg差不多,只是在rolabelImg中可以画旋转的矩形,下载地址rolabelImg具体操作如下:进入这个目录下,输入cmd进入终端:依次输入以下代码将会启动程序pyrcc5 -o resources.py resources.qrcpython labelImg.py接下来就是标记了,画出第一...原创 2019-05-07 17:04:55 · 4499 阅读 · 0 评论