2019年08月_纸上得来终觉浅～

原创详解resnet解决梯度消失问题

1、ResNet 起源ResNet 的出发点是，在一个浅层的网络模型上进行改造，将新的模型与原来的浅层模型相比较，改造后的模型至少不应该比原来的模型表现要差，极端情况下，新加层的结果为 0，这样它就等同于原来的模型了。2、瓶颈结构对于每个残差函数 f，使用3个层叠层，分别为1×1、3×3和1×1卷积，其中1×1层负责减小/增加尺寸，3×3层为瓶颈层。假设现在有一个由3个卷积层...

2019-08-31 21:45:28 9300 1

转载 tensorflow遇到ImportError: Could not find 'cudart64_100.dll'错误解决

2019-08-31 11:44:15 642

原创 YOLO1、YOLO2、YOLO3对比

YOLO详解参见地址：YOLO1：https://blog.csdn.net/qq_32172681/article/details/99418000YOLO2：https://blog.csdn.net/qq_32172681/article/details/99482044YOLO3：https://blog.csdn.net/qq_32172681/article/details...

2019-08-27 17:40:26 10896

原创 opencv滤波、腐蚀、膨胀操作

1、均值滤波（简单的平均卷积操作）：blur = cv2.blur(img,(3,3))# (3,3)为卷积核大小2、方框滤波（基本和均值滤波一样，可以选择归一化）：box = cv2.boxFilter(img,-1,(3,3),normolize=True)# normolize=True表示卷积操作后除以9，也就是归一化3、高斯滤波：gussian = cv...

2019-08-27 13:52:09 436

原创 opencv图像基本操作

1、版本工具opencv_python 3.4.1.15opencv_python_contrib_python 3.4.1.15jupyter notebook2、读图像（BGR格式）：cv2.imread('cat.jpg')3、展示图像：cv2.imshow()4、等待时间（0表示任意键终止）：cv2.waitkey(1000)5、图像保存：cv2...

2019-08-27 13:49:43 178

原创 RCNN、Fast RCNN、Faster RCNN对比

RCNN、Fast RCNN、Faster RCNN详解参考以下文章：RCNN：https://blog.csdn.net/qq_32172681/article/details/99105617Fast RCNN：https://blog.csdn.net/qq_32172681/article/details/99194233Faster RCNN：https://blog.csd...

2019-08-27 10:26:17 5722 1

AI 科技评论按：本文作者 Ronald，首发于作者的知乎专栏「炼丹师备忘录」，AI 科技评论获其授权转发。目前目标检测领域的深度学习方法主要分为两类：two stage 的目标检测算法；one stage 的目标检测算法。前者是先由算法生成一系列作为样本的候选框，再通过卷积神经网络进行样本分类；后者则不用产生候选框，直接将目标边框定位的问题转化为回归问题处理。正是由于两种方法的差异，在性能上...

2019-08-26 22:41:31 8807 2

原创查全率（precison）和查准率（recall）

定义以下标记：tp：正确的标记为正；预测为真，实际为真fp：错误的标记为正；预测为假，实际为假tn：正确的标记为负；预测为真，实际为假fn：错误的标记为负；预测为假，实际为真查准率：precision = tp / (tp+fp) ；宁愿漏掉，不可错杀；正确预测占所有预测的比例查全率：recall = tp / (tp+fn) ；宁可错杀，不可漏掉；正确预测占所有...

2019-08-26 21:00:07 4985 1

转载 K近邻算法

2019-08-25 20:37:36 466

原创概率图模型（马尔可夫模型）

一、马尔可夫过程1、马尔可夫过程一个马尔科夫过程就是指过程中的每个状态的转移只依赖于之前的n个状态，这个过程被称为1个n阶的模型，其中n是影响转移状态的数目。最简单的马尔科夫过程就是一阶过程，每一个状态的转移只依赖于其之前的那一个状态。2、马尔可夫链马尔可夫链是随机变量X1,X2,X3…的一个数列。这些变量的范围，即他们所有可能取值的集合，被称为状态空间。设表示随机...

2019-08-25 17:40:42 7539 1

原创常用论文地址整理

1、目标检测R-CNN: https://arxiv.org/abs/1311.2524Fast R-CNN: https://arxiv.org/abs/1504.08083Faster R-CNN: https://arxiv.org/abs/1506.01497Mask R-CNN: https://arxiv.org/abs/1703.068702、对抗生成网络...

2019-08-25 15:00:57 614

转载循环神经网络LSTM论文解读

2019-08-25 14:19:24 18500 3

转载循环神经网络RNN论文解读

2019-08-25 10:38:10 34451 2

转载 2018年视觉所有干货博文的分类汇总

https://blog.csdn.net/jacke121/article/details/85568966

2019-08-22 17:39:58 92

转载人脸识别算法FaceNet论文解读

2019-08-22 17:10:49 1887

转载三元组损失 Triplet Loss及其梯度

2019-08-22 16:32:26 2797

转载人脸识别算法DeepFace论文解读

2019-08-22 15:08:25 5331

转载 LBP算法（人脸识别特征提取）

LBP（Local Binary Patterns，局部二值模式）是提取局部特征作为判别依据的。LBP方法显著的优点是对光照不敏感，但是依然没有解决姿态和表情的问题。不过相比于特征脸方法，LBP的识别率已经有了很大的提升。在[1]的文章里，有些人脸库的识别率已经达到了98%+。1、LBP特征提取最初的LBP是定义在像素3x3邻域内的，以邻域中心像素为阈值，将相邻的8个像素的灰度值与其...

2019-08-22 14:44:41 7891

原创图像分类算法DenseNet论文解读

论文名称：Densely Connected Convolutional Networks论文地址：https://arxiv.org/pdf/1608.06993.pdf如果说ResNet扩展了网络的深度，GoogLeNet扩展了网络的宽度，那么DenseNet就是利用特征图的重用。一、论文解读1、DenseNet介绍传统的具有L层的卷积网络在每一层和它的下一...

2019-08-21 22:30:15 1498

原创 GoogLeNet Inception v1-v4 简单对比

本文只对Inception的4个版本做了简单对比，详细内容参考：https://blog.csdn.net/qq_32172681/article/details/999773041、inception v1inception v1提出了inception模块，用1*1卷积实现通道降维和增维，增加了网络深度和宽度。2、inception v2inception v2...

2019-08-21 21:11:29 390

转载图像分类算法GoogLeNet论文解读（Inception v1、v2、v3、v4）

[v1] Going Deeper with Convolutions, 6.67% test error, http://arxiv.org/abs/1409.4842[v2] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, 4.8% test error...

2019-08-21 17:49:31 3585

原创图像分类算法ResNet论文解读

论文名称：Deep Residual Learning for Image Recognition论文地址：https://arxiv.org/pdf/1512.03385.pdf代码地址：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/slim/python/slim/nets/resnet_...

2019-08-21 13:14:09 3889

原创图像分类算法VGGNet论文解读

论文名称：VeryDeepConvolutional Networks ForLarge-Scale Image Recognition论文地址：https://arxiv.org/pdf/1409.1556.pdfVGGNet的主要贡献是，研究了卷积网络深度对大规模图像识别中卷积网络精度的影响，使用3×3卷积滤波器，将网络深度推至16-19层，显著地提高了分类性能。...

2019-08-20 15:17:13 1076

原创图像分类算法AlexNet论文解读

论文名称：ImageNet Classification with Deep Convolutional Neural Networks论文地址：http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdfAlexNet训练了一个更深的卷积神经网...

2019-08-20 13:09:10 1132

原创语义分割算法Mask RCNN论文解读

论文名称：Mask R-CNN论文地址：https://arxiv.org/abs/1703.06870代码地址：https://github.com/matterport/Mask_RCNNsummary：object detection + semantic segmentation = instance segmentationmaskedrcnn achieve...

2019-08-19 21:43:04 3707 2

转载 RoIPooling与RoIAlign的区别

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。原文链接：https://www.cnblogs.com/codehome/p/10910180.html1、RoIPooling通过对Faster RCNN的学习我们了解的RolPooling可以使生成的候选框region proposal映射产生固定...

2019-08-19 16:25:57 2146 2

转载双线性插值

本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。原文链接：https://www.cnblogs.com/codehome/p/10910180.html1、为什么要用双线性插值法在图像的放大和缩小的过程中，需要计算新图像像素点在原图的位置，如果计算的位置不是整数，就需要用到图像的内插，我们需要寻找在...

2019-08-19 16:14:42 609

原创图像分割算法FCN论文解读

论文名称：Fully Convolutional Networks for Semantic Segmentation论文地址：https://arxiv.org/pdf/1411.4038.pdf代码地址：https://github.com/shekkizh/FCN.tensorflow语义分割是指对图像进行像素级别的分类，即标注出图像中每个像素所属的类别。这篇论文是语义...

2019-08-19 15:34:03 1941 1

原创对抗神经网络CycleGAN论文解读

论文题目：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks论文地址：https://arxiv.org/pdf/1703.10593.pdf本文提出了一种在没有成对图像的情况下，学习将图像从源域x转换为目标域y的方法。它使用两个镜像对称的GAN，构成了一个环形网络，两个GAN...

2019-08-16 16:30:14 1960

原创 GAN模式崩溃

先把参考文章放在前面，我对里面的内容按照自己的思路进行整理～http://www.dataguru.cn/article-14563-1.htmlhttps://blog.csdn.net/gdengden/article/details/888378351、首先用通俗易懂的语言介绍一下什么叫模式崩溃？比如手写数字识别，0-9一共10个数字，假设有10个模式，而我们网络只...

2019-08-16 14:25:01 5811 1

转载 GAN训练不稳定原因

2019-08-16 11:25:04 8560

原创深度卷积对抗生成网络DCGAN论文解读

论文名称：Unsupervised representation learning with deep convolutional generative adversarial networks论文地址：https://arxiv.org/pdf/1511.06434.pdf代码地址：https://github.com/carpedm20/DCGAN-tensorflowDCG...

2019-08-16 10:58:19 2338

原创常用生成模型 -- GAN

1、GAN简介GAN，对抗生成网络，包括两个网络，即生成器G与判别器D。它们的功能分别是：（1）G是一个生成图片的网络，它接收一个随机的噪声z，通过这个噪声生成图片，记做G(z)。相当于decoder。（2）D是一个判别网络，判别一张图片是不是“真实的”。它的输入参数是x，x代表一张图片，输出D（x）代表x为真实图片的概率，如果为1，就代表100%是真实的图片，而输出为0，就代表不可...

2019-08-15 22:11:17 3031

转载目标检测算法SSD论文解读

2019-08-15 14:13:27 2600

原创目标检测算法YOLO3论文解读

论文题目：YOLOv3: An Incremental Improvement论文地址：https://arxiv.org/abs/1804.02767代码地址：https://github.com/aloyschen/tensorflow-yolo3一、论文解读1、bounding box prediction（边界框预测）YOLO2预测bounding boxes是使...

2019-08-14 20:24:32 1862

原创目标检测算法YOLO2论文详解

论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文地址：https://arxiv.org/pdf/1612.08242v1.pdf相对于YOLO1，YOLO2提出了很多方案改进网络的性能，比如（1）批正则化数据（2）用更高的分辨率以适应小图像的检测（3...

2019-08-14 15:55:34 2266

转载 K-mean clustering（K均值聚类算法）

一、聚类与分类的区别分类：类别已知，通过对已知分类的数据进行训练和学习，找到这些不同类的特征，再对未分类的数据进行分类。是有监督学习。聚类：事先不知道数据会分为几类，通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。属于无监督学习。二、k-means 聚类（物以类聚，人以群分）1、首先输入 k 的值，即我们指定希望通过聚类得到 k 个分组；2、从数据...

2019-08-13 19:29:42 5411 6

原创批量正则化Batch Normalization

1、为什么随着网络深度增加，神经网络训练越来越慢呢？因为深层神经网络在做非线性变换前的激活输入值，随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动。训练收敛慢，一般是因为整体分布逐渐往非线性函数的取值区间的上下限两端靠近，这导致反向传播时低层神经网络的梯度消失，这是训练深层神经网络收敛越来越慢的本质原因。2、BN（Batch Normalization）的基本思想BN...

2019-08-13 16:40:07 4921

原创目标检测算法YOLO1论文解读

论文题目：You Only Look Once: Unified, Real-Time Object Detection论文地址：https://arxiv.org/pdf/1506.02640.pdf代码地址：https://github.com/hizhangp/yolo_tensorflow与RCNN系列不同，YOLO将物体检测看作一个单一的回归问题，直接从图像生成boun...

2019-08-13 15:13:44 1832

原创目标检测算法Faster R-CNN论文解读

论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks论文地址：https://arxiv.org/abs/1506.01497代码地址：https://github.com/endernewton/tf-faster-rcnn或者https://github.com/dB...

2019-08-12 17:08:20 1888

空空如也

空空如也