![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图像识别
文章平均质量分 81
rainingmoon
拓展,开阔
展开
-
图像识别3-VGGNet-very deep convolutional Network for large-scale image recognition
文章重点:1.使用更小的3*3的卷积核与更深的网络(16-19层)获得了比ZFNet和AlexNet更好的效果,并且作者测试了不同的数据集证明了该网络具有很好的泛化性,在其他的测试集上也表现出了很好的性能。2.作者对比了5种深度的卷积网络证明深度越深,在训练数据越大的情况下效果越好。3.使用了多尺度缩放数据增强技术,证明效果比单尺度数据增强效果提高接近%1.4.网络的配置:原创 2018-01-23 22:55:49 · 676 阅读 · 0 评论 -
卷积网络的进化史
这篇文章是对卷积网络进化过程的详细描述,非常的全面,思路清晰,转自https://tracholar.github.io/machine-learning/2017/07/23/cnn-evalution.html, 留作学习资料学习卷积网络有一段时间了,对卷积网络的演变过程中的一些基本思路有一个大致的理解, 于是总结出了这篇文章,一方面是加深自己的理解,一方面也希望对学习卷积网络的读者有所帮助。...转载 2018-06-22 18:08:01 · 5226 阅读 · 0 评论 -
余弦距离、欧氏距离和杰卡德相似性度量的对比分析
余弦距离、欧氏距离和杰卡德相似性度量的对比分析1、余弦距离 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 向量,是多维空间中有方向的线段,如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近。而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角。 余弦定理描述了三角形中任何一个夹角和三个边的关系。给定三角形的三条边,可以使...转载 2018-05-23 18:41:00 · 240 阅读 · 0 评论 -
论文阅读:Deep Metric Learning via Lifted Structured Feature Embedding
首先,介绍一下embedding的概念(该思想参考自知乎):Embedding在数学上表示一个maping: , 也就是一个function。其中该函数满足两个性质:injective (单射的):就是我们所说的单射函数,每个Y只有唯一的X对应;structure-preserving(结构保存):比如在X所属的空间上 ,那么映射后在Y所属空间上同理 。那么对于word embedding,...原创 2018-05-02 17:30:37 · 622 阅读 · 0 评论 -
图像检测4-fast-rcnn-Proceedings of the IEEE International Conference on Computer Vision.
转载 2018-02-08 10:26:34 · 4583 阅读 · 0 评论 -
Ubuntu14.04搭建Caffe(仅CPU)详解教程
这篇文章主要介绍了Ubuntu14.04在系统平台(未使用anaconda环境管理)搭建CPU版Caffe,无GPU,详解教程,操作系统是Ubuntu 14.04,本文分步骤给大家介绍的非常详细,具有参考借鉴价值,需要的朋友可以参考下.操作系统: Ubuntu 14.04PYTHON版本:2.7,使用python3会有各种包依赖问题是否使用PYTHON API: 是, 目标是安装后CAFFE能作为...原创 2018-02-12 07:50:42 · 717 阅读 · 0 评论 -
win10+VS2015+cuda+cudnn安装与配置Caffe
需要使用的工具:Git: 可直接使用GitHub提供的工具GitHubDesktopVisual Studio 2015: 可以使用免费的社区版,安装的时候一定要勾选开发组件,确保C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC\bin\amd64下有cl.exe程序,否则没有安装完全,后面会出错。Python: 下载64位版本,建议使用...原创 2018-02-26 22:49:26 · 3266 阅读 · 0 评论 -
图像检测3-OverFeat-Integrated Recognition,Localization,and Detection using Convolutional Networks
基于Overfeat的图片分类、定位、检测原文地址:http://blog.csdn.net/hjimce/article/details/50187881作者:hjimce一、相关理论本篇博文主要讲解来自2014年ICLR的经典图片分类、定位物体检测overfeat算法:《OverFeat: Integrated Recognition, Localizati转载 2018-01-30 13:56:10 · 309 阅读 · 0 评论 -
图像检测2-SPPNet-Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
本文参考了前人的博客,觉得写的已经很好啦,借鉴过来学习一下。 这里参考的链接如下: http://blog.csdn.net/xjz18298268521/article/details/52681966论文: 《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》 本篇博文转载 2018-01-26 21:29:25 · 272 阅读 · 0 评论 -
图像文章阅读2-ZFNet-Visualizing and Understanding Convolutional Networks
一、文章作者: Matthew D. Zeiler 和Rob Fergus Dept. of Computer Science, Courant Institute, New York University原文链接:http://arxiv.org/pdf/1311.2901.pdf二、简介:该文章从可视化的角度分析AlexNet(即卷积神经网络)成功的原因,解释了为什么卷即神原创 2018-01-18 22:23:58 · 238 阅读 · 0 评论 -
图像检测1-R-CNN-Rich featurehierarchies for accurate object detection and semantic segmentation
论文:《Rich featurehierarchies for accurate object detection and semantic segmentation》这里我也是借鉴了前辈的博客:http://blog.csdn.net/xjz18298268521/article/details/52412991,在此基础上我引入了另一篇关于selective research原理的转载 2018-01-26 12:20:31 · 282 阅读 · 0 评论 -
图像分类阅读4-GoogLeNet-Going Deeper with Convolutions
本文转载自:http://blog.csdn.net/shuzfan/article/details/50738394本文介绍的是著名的网络结构GoogLeNet及其延伸版本,目的是试图领会其中的思想而不是单纯关注结构。GoogLeNet Incepetion V1MotivationArchitectural DetailsGoogLeNetConclus转载 2018-01-26 11:53:09 · 335 阅读 · 0 评论 -
非极大抑制(Non-Maximum Suppression)和Hard negative mining
一、Nms主要目的 在物体检测非极大抑制应用十分广泛,主要目的是为了消除多余的框,找到最佳的物体检测的位置。如上图中:虽然几个框都检测到了人脸,但是我不需要这么多的框,我需要找到一个最能表达人脸的框。下图汽车检测也是同样的原理。非极大值抑制因为一会儿讲RCNN算法,会从一张图片中找出n多个可能是物体的矩形框,然后为每个矩形框转载 2018-01-25 14:03:21 · 1604 阅读 · 0 评论 -
CNN接受域( receptive field)的计算
A guide to receptive field arithmetic for CNN原文:click hereCNN的两大神器之一,局部感知野(另一个是权值共享)。一般认为,人类的对外界的感知都是从局部到全局的,而对于图像来说,也是局部的像素在空间上的联系较为紧密(比如离得近的像素可能具有相同的颜色纹理),距离较远的像素相关性较弱。因而,每个神经元没有必要对全局进行感知,只需要对局部进行感知转载 2018-01-17 11:13:34 · 12610 阅读 · 0 评论 -
图像识别文章阅读1-ImageNet Classification with Deep Convolutional Neural Network-2012
ImageNet Classification with Deep Convolutional Neural NetworksAlex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton摘要我们训练了一个大型的深度卷积神经网络,来将在ImageNet LSVRC-2010大赛中的120万张高清图像分为1000个不同的类别。对测试数据转载 2018-01-16 14:44:36 · 857 阅读 · 0 评论 -
卷积神经网络中卷积、反卷积、池化解析
感谢博主:https://blog.csdn.net/gqixf/article/details/785495451.前言 传统的CNN网络只能给出图像的LABLE,但是在很多情况下需要对识别的物体进行分割实现end to end,然后FCN出现了,给物体分割提供了一个非常重要的解决思路,其核心就是卷积与反卷积,所以这里就详细解释卷积与反卷积。 对于1维的卷积,公式(离散)与计算过程(连...转载 2018-06-01 10:53:23 · 5524 阅读 · 1 评论