![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
ComputerVision
文章平均质量分 74
Andrewseu
A man in the road---Fighting!
展开
-
opencv得到图像的RGB颜色直方图
图像处理中,直方图是一个很强有力的工具. 其实直方图就是对颜色像素的统计,将统计值放到相应的bin中. 这里就涉及到bin的概念了,刚开始的时候对这个概念很疑惑.bin的概念:颜色空间划分的区间即是直方图的bin. 举个例子,灰度图有256个值,如果把每个值划分一个单独的区间,则可以说直方图有256个bin,当然bin越大,颜色区分就越细,但是同时也增加了计算的复杂性.下面的代码实原创 2015-11-03 15:07:52 · 11107 阅读 · 7 评论 -
caffe finetuning CaffeNet流程总结
所谓finetuning,就是说我们针对某相似任务已经训练好的模型,比如CaffeNet, VGG-16, ResNet等, 再通过自己的数据集进行权重更新, 如果数据量比较小,可以只更新最后一层,其他层的权重不变,如果数据量中等,可以训练后面几层,如果数据量很大,那OK,直接从头训练,只不过在训练时间上,需要花费比较多。选择Caffe做finetuning的原因在于,相比于tenso原创 2017-04-12 16:00:46 · 6917 阅读 · 1 评论 -
Factors in Finetuning Deep Model for Object Detection with Long-tail Distribution解读
微调已经在很多视觉任务上都有一个state-of-art的performance,比如说追踪,分割,物体检测,动作识别等等。但是不同的微调方法对结果也是不一样的,这篇论文主要探索了物体检测上微调中对performance的影响因素。经验和分析结果都告诉我们有更多样本的类对feature learning的影响是更大的,因此最好是能够把样本分布均匀。提出一种层级的feature learning原创 2017-04-15 23:00:09 · 1931 阅读 · 0 评论 -
Deep Residual Learning for Image Recognition(ResNet)残差网络解读
Kaiming 的Resnet在2015年横扫各大视觉主流比赛榜单,对工业界和学术界都产生了巨大而深远的影响,论文拿下了CVPR2016的best paper award。首先来看看ResNet的威力:不仅拿了第一,还超过第二一大截。我们就来看看ResNet的神奇之处。Is learning better networks as easy as stacking more原创 2017-04-16 12:05:50 · 3594 阅读 · 0 评论 -
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition(SPP-Net)解读
论文发表在ECCV2014作者:Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian SunIntroductionCNN 在视觉领域虽然取得了很大的成就,但是一直存在一个技术问题是CNN都需要一个固定的图片大小,比如224*224,这限制了输入图像的大小和比例。现在的方法主要是通过crop/warp来满足对图像大小原创 2017-04-16 17:02:08 · 2497 阅读 · 0 评论 -
Fast R-CNN解读
Introduction由于检测的复杂性,目前的一些模型都是多阶段的训练过程,首先是得到region proposals,然后提取region feature,预测bounding box, 最后进行精修,这一系列过程并不是端到端的,需要存储大量的中间特征,耗费大量的空间,并且训练过程很慢,也不elegant.因此,rgb大神把这整个过程串起来了,提出一个单阶段训练算法,同时把object原创 2017-04-23 17:09:42 · 1501 阅读 · 0 评论 -
GMS: Grid-based Motion Statistics for Fast, Ultra-robust Feature Correspondence解读
介绍特征匹配时很多计算机视觉算法的基础,因此速度、准确率和健壮性都是很重要的因素,目前在速度和健壮性上还存在很大的gap。主要问题在于使用在更强大的特征一致技术的一致性约束(相邻的像素运动是相似的)。一致性约束是强大的限制但是稀疏的特征缺乏定义良好的邻居,这就导致基于一致性的技术计算代价昂贵并且很难执行。这篇论文提出了GMS(Grid-based Motion Statistics, 基于网格原创 2017-05-25 16:35:19 · 6601 阅读 · 5 评论 -
Visualizing and Understanding Convolutional Networks(ZF-Net)解读
会议: ECCV 2014Introduction自从AlexNet出现出现之后,大量的CNN都冒出来取得了很好的分类效果,但是,存在有两个问题,一个是对CNN为什么能够表现得如此之好并不清楚;二是他们的表现怎么能够提升;这篇论文探索的就是这两个问题,同时提出的ZF-Net取得了ILSVRC 2013图像分类冠军。CNN成功的要素主要有三个方面的原因,(1)有大得多的训原创 2017-05-09 21:17:02 · 1191 阅读 · 0 评论 -
Generative Adversarial Nets (GAN)解读
会议:NIPS 2014IntroductionGAN,生成对抗式网络是是Ian Goodfellow经典的大作,引起了很大的轰动,后面的各种GAN也层出不穷。追根溯源,为了了解GAN,需要从这篇开山之作说起。那GAN到底是什么?简单来说,GAN由两个模型组成,一个是生成模型G,一个是判别模型D,G负责从给定训练数据中学习数据的概率分布而D负责判别G生成出来的数据是不是符合真实数据原创 2017-06-18 21:10:18 · 1888 阅读 · 1 评论 -
Docker-tensorflow跑VGG16
在我们的实际项目中,一般不会直接从第一层直接开始训练,而是通过在大的数据集上(如ImageNet)训练好的模型,把前面那些层的参数固定,在运用到我们新的问题上,修改最后一到两层,用自己的数据去微调(fineturn),一般效果也很好。如果要在docker上的tensorfow上跑,我们需要做以下几件事情:1.下载好VGG16的权重文件一般是 VGG16_Weights.npy ,或者V原创 2017-03-31 11:07:28 · 6181 阅读 · 7 评论 -
TFlearn 运行Alexnet
TFlearn是一个高度封装的库,结构简洁明了,适用于新手,后期可以进一步去根据需要再进行深度学习!文档在这:http://tflearn.org/Alexnet用于Oxford 17 Category Flower Dataset分类,包含17个类,每个类80个图片;# -*- coding: utf-8 -*-""" AlexNet.Applying 'Alexnet'原创 2017-03-28 16:34:06 · 4228 阅读 · 0 评论 -
R-CNN论文解读
论文题目: Rich feature hierarchies for accurate object detection and semantic segmentation作者: Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik会议: 2014 CVPR1. R-CNN是什么R-CNN就是Regions wit原创 2017-03-28 14:19:01 · 1621 阅读 · 0 评论 -
图像特征提取
特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往转载 2015-10-14 17:00:27 · 7265 阅读 · 0 评论 -
opencv无法读取视频解决方法&&抽取视频帧存储为图像(python)
1.opencv无法读取视频解决方法最近有抽取视频帧的需求,因此安装了opencv,直接去读取视频,发现一直打不开.具体原因:机器上没有相应的解码器;官方说明:解决方案:1.把D:\openCV\opencv\sources\3rdparty\ffmpeg\opencv_ffmpeg_64.dll复制到D:\Python下;2原创 2015-10-13 16:40:15 · 11585 阅读 · 1 评论 -
RGB到HSV颜色空间的转换
图像特征的低层视觉特征主要有纹理、原创 2015-11-02 11:39:26 · 18799 阅读 · 6 评论 -
视频特征提取(未完)
1.前言视频的特征提取可以分为声音的特征特提取和图像的特征提取(抽取关键帧), 特征提取是一个关键的步骤,为后面机器学习算法的应用提供了基础。2.特征(1)lighting key multiplying the average value V (in HSV) by the standard deviation of the values V (in HSV).在HSV颜色空原创 2015-11-16 16:26:58 · 9261 阅读 · 0 评论 -
图片情感研究现状与思考
图片可以在情感层面上影响人,也能够直接表达人的情感。对于个人来说,图片情感是很主观的,但是人类对于图片的情感认知是有共性的,这也是图片情感识别的基础。现在关于图片情感的研究主要集中在两个方面:图片情感识别、情感图片检索。为了识别图片的情感,需要提取图片的相关特征,建立模型,来填补图片本身与情感之间的情感鸿沟(affective gap)。关于情感特征的提取,也是图片情感领域一直以来的热点问题。情感原创 2016-04-12 18:08:25 · 6950 阅读 · 0 评论 -
图像情感识别
今天组会讲了一个情感图片识别的例子,其实也是一个比较普通的机器学习的过程,但是总体来说涉及到的东西还是很广的,在此再次总结分享一下。问题简单来说就是对图片情感进行分类,分别是Amusement, Anger, Awe, Contentment, Disgust, Excitement, Fear, Sadness八个类。先上整个的流程图:首先我们必须有一个有label的图片数据原创 2016-06-06 21:56:05 · 16573 阅读 · 24 评论 -
矩阵卷积理解
在图像处理的过程中,经常会看到矩阵卷积的概念,比如说用一个模板去和一张图片进行卷积,因此很有必要了解矩阵卷积到了做了什么,具体又是怎么计算的。 在matlab中有conv2函数对矩阵进行卷积运算,其中有一个shape参数,取值具体有三种: -full - (default) returns the full 2-D convolution, -'same' - returns the cen原创 2016-06-29 15:08:08 · 34605 阅读 · 1 评论 -
SIFT特征
CV界大名鼎鼎的SIFT特征,今天终于要揭开你的面纱!我的学习历程是先看了一些博客,发现并不是很能够理解,跳跃性比较强,没有前因后果,但是Lowe 在04年的那篇论文中详细总结了SIFT特征整个提取流程的思想和原因,因此建议读者可以直接从原文入手,辅以博文以及一些著名大学CV课程的ppt,这样才能深入了解掌握。链接在此http://www.cs.ubc.ca/~lowe/keypoints/介绍原创 2016-06-30 20:09:05 · 1357 阅读 · 1 评论 -
CS231n Assignment2--Fully-connected Neural Network
课程网址:http://cs231n.github.io/assignments2016/assignment2/主要目的是保存一下一个比较完整的全连接神经网络代码,不带说明了,代码说明也比较详细。dataset.py# -*- coding: utf-8 -*-import numpy as npdef unpickle(file): import c原创 2017-02-26 20:39:11 · 2588 阅读 · 0 评论 -
Nearest Neighbor算法对Cifar-10数据集进行分类
1.preliminaryNearest Neighbor 算法的思想是同一类型的东西总是有一些相似点,在某个空间里是聚集在一起的。比如说对于一直狗和鸡,属于两个不同的物种,鸡有两条腿而都狗有四条腿,狗的叫声是“汪汪”而鸡的叫声是“咯咯”。所以不同的特诊会使鸡和狗聚集在两块不同的区域。一般在现实应用中是不会用1NN的,我们用的更多KNN,至于k的大小是多少,针对不同的问题答案是不一样的,这原创 2016-04-08 22:36:43 · 8943 阅读 · 3 评论