计算机视觉
Blateyang
硕士毕业于华南理工大学,目前主要从事Web开发方面的工作,平时很少看留言,有事请私信
展开
-
SIFT特征和SURF特征比较
SIFT特征和SURF特征都是优秀的尺度不变特征,常用来进行物体辨识和图像匹配。所谓的尺度不变特征是指每个检测到的特征点都伴随着对应的尺寸因子(特征点的局部尺寸参数与特征的尺度成正比),下面就这两种著名的尺度不变特征进行简要的介绍和比较。(PS:由于两种特征提取算法的细节较多,本篇文章只简单介绍它们的原理、主要步骤和简单应用,主要关注两者的比较)原创 2017-08-01 11:07:34 · 25990 阅读 · 0 评论 -
非极大值抑制算法(NMS)及python实现
在目标检测中,常会利用非极大值抑制算法(NMS)对生成的大量候选框进行后处理,去除冗余的候选框,得到最具代表性的结果,以加快目标检测的效率。即如下图所示,消除多余的候选框,找到最佳的bbox。 NMS算法过程根据候选框的类别分类概率做排序:ABCDEFA先标记最大概率矩形框F是我们要保留下来的;从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU(两框的交并比)是否大于某原创 2018-01-20 11:55:12 · 17231 阅读 · 8 评论 -
Detectron研读和实践一:detectron框架概览
引言Detectron是Facebook AI研究院(FAIR)于2018年初公开的目前为止业内最佳水平的目标检测平台。据介绍,该项目自 2016 年 7 月启动,构建于 Caffe2 之上,目前支持大量机器学习算法,其中包括 Mask R-CNN(何恺明的研究,ICCV 2017 最佳论文)和 Focal Loss for Dense Object Detection,(ICCV 2017 ...原创 2018-02-16 18:34:21 · 9556 阅读 · 1 评论 -
Detectron研读和实践二:getting _started例子faster_rcnn_R-50-FPN
版权声明:本文为博主原创文章,未经博主允许不得转载。 关于Detectron的介绍可以参看我的上一篇博客。此篇博客主要是对Detectron的getting_started例子faster_rcnn_R-50-FPN模型的相关代码进行分析。1.相关原理简介该模型主要涉及两个网络模块:基于ResNet50的FPN特征提取网络和Faster R-CNN目标检测网络。实际上,该模型是对F...原创 2018-02-18 17:59:08 · 6578 阅读 · 10 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记二:图像形成
总结了几何相机模型、光和阴影以及颜色的一些知识点原创 2017-08-23 12:31:23 · 2240 阅读 · 0 评论 -
Detectron研读和实践三:用faster_rcnn_R-50-FPN训练PASCAL VOC数据集
该系列上一篇博客介绍了Detectron的getting started例子faster_rcnn_R-50-FPN的一些源码分析,这次来实践一下,用faster_rcnn_R-50-FPN模型训练PASCAL VOC数据集。平台和环境:Ubuntu16.04+GTX1080ti+CUDA 8.0+cudnn5.11 为Detectron准备PASCAL VOC数据集1.1 下...原创 2018-04-04 12:25:14 · 5620 阅读 · 8 评论 -
Detectron研读和实践四:用Mask R-CNN进行服饰关键点定位
前段时间参加了阿里天池的FashionAI服饰关键点定位比赛,为了做比赛,博主尝试用Detectron里面的Mask R-CNN去做关键点定位,取得了一定效果,也算是对Detectron的一些实践,特此做一些记录,希望对需要的朋友有所帮助。原创 2018-04-22 20:30:51 · 7402 阅读 · 26 评论 -
CS231n课程笔记Optimization Note翻译
原文链接:https://zhuanlan.zhihu.com/p/21360434?refer=intelligentunit译者注:本文智能单元首发,译自斯坦福CS231n课程笔记Optimization Note,课程教师Andrej Karpathy授权翻译。本篇教程由杜客翻译完成,李艺颖和堃堃进行校对修改。译文含公式和代码,建议PC端阅读。译者注:本文智能单元首发,译自斯坦福CS2...转载 2018-05-21 18:27:01 · 441 阅读 · 0 评论 -
将用LabelImg标注得到的VOC格式数据集标签(xml文件)转换成COCO格式(json文件)
写在前面的话: 制作数据集和处理数据看似是体力活,但对于机器学习和深度学习应用而言是非常重要的,千万不能掉以轻心,要认真对待,及时检查。如果数据有问题或者没处理好,再好的模型也无济于事。自从Facebook开源了Detectron目标检测框架后,很多原先用VOC格式数据集(指标注文件)训练目标检测模型的人需要将VOC格式的xml标注文件转换成COCO格式的json标注文件,但Detect...原创 2018-06-11 21:26:29 · 18054 阅读 · 14 评论 -
浅谈VOC数据集的mAP的计算过程
目标检测中最常用的测评指标就是mAP(mean Average Precision),但对其计算过程一直似懂非懂,没有完全弄清楚。在看过网上一些资料后,自以为弄清楚了,下面以倒叙的方式简单谈谈自己的理解,目的在于做个记录,如果有读者没看懂或者觉得博主理解有误,欢迎交流探讨。mAP是对各目标类计算得到的AP取平均值,要理解mAP,就要知道AP是怎么算的。某类目标(假设为car)的AP可以理解...原创 2018-07-15 17:20:03 · 10651 阅读 · 2 评论 -
关于RPN中proposal的坐标回归参数的一点理解及Faster R-CNN的学习资料
在Faster R-CNN的区域生成网络RPN中为了能够以目标真实框(Ground Truth box)为监督信号去训练RPN网络依据anchor预测proposal的位置,作者并不是直接回归proposal的(x,y,w,h),而是采用了以下形式的参数化坐标偏移向量(tx,ty,tw,th)(t_x,t_y,t_w,t_h)(tx,ty,tw,th),其具体计算公式如下:其中(x,y...原创 2018-12-04 22:22:34 · 2746 阅读 · 0 评论 -
py-faster-rcnn 安装、测试和训练自己的数据
系统环境:Ubuntu16.04+CUDA8.0+Cudnn5.1py-faster-rcnn安装和测试参考这篇博客Ubuntu16.04+GT720M + Cuda8.0+py-faster-rcnn(caffe) 注:没有使用Cudnn用py-faster-rcnn训练自己的数据参考这篇博客 Faster-RCNN+ZF用自己的数据集训练模型(Python版本)原创 2018-01-11 17:13:02 · 821 阅读 · 0 评论 -
利用Keras使用非常少的数据建立强大的图像分类模型
博客原文在本教程中,我们将介绍一些简单而有效的方法,您可以使用这些方法来构建强大的图像分类器,仅使用极少数的训练实例 - 只需从您想要识别的每个类别中挑选几百或几千张图片即可。我们将会涵盖以下内容:从零开始训练一个小网络(作为基准)使用预训练网络的bottleneck features微调预训练模型的顶层翻译 2018-01-27 21:44:29 · 10927 阅读 · 8 评论 -
#目标检测#对R-FCN网络以及position-sensitive score map的理解
引言R-FCN网络是Faster R-CNN之后又一个比较著名的基于Region Proposal的目标检测网络,它可以达到与Faster R-CNN相近的mAP,且速度要快好几倍。 R-FCN论文原文:R-fcn: Object detection via region-based fully convolutional networks R-FCN论文译文:基于R-FCN的物体检测——原创 2017-12-02 21:22:07 · 5959 阅读 · 3 评论 -
计算机视觉中对训练数据处理以提高分类器性能的技巧
在看《Computer Vision:A Mordern Approach》第二版中关于“分类”一章时,书中讲道了处理图像训练数据的两个非常有用的tricks,即数据增强和bootstraping,特此记录下来,相信这两个数据处理的技巧无论是在传统的机器学习还是流行的深度学习中都很有指导意义。原创 2017-07-25 14:02:06 · 984 阅读 · 0 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记一:导论大纲
David Forsyth的《Computer Vision-A Modern Approach(2nd edition)》是CV领域的经典教材之一,介绍了许多CV领域的基本知识和现代技术,按照图像形成、早期(低层)视觉、中层视觉、高层视觉以及CV的实际应用来组织内容,脉络清晰。本系列博文是关于该书主要内容的思维导图和知识点整理。原创 2017-08-23 10:57:23 · 3314 阅读 · 2 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记三:早期视觉(一幅图像)
对原书的第二部分——早期视觉(一幅图像)进行了摘录和整理,内容包含线性滤波器、局部图像特征(边缘、角点、邻域)以及纹理。原创 2017-09-06 17:23:48 · 1056 阅读 · 0 评论 -
SIFT特征提取算法小结及实现
SIFT特征提取算法小结SIFT(Scale Invariant Feature Transformation)特征提取算法是用于提取对尺度、旋转以及光照等鲁棒的图像局部特征并进行描述的经典算法,广泛应用于图像匹配等领域中,其主要步骤有以下几点:1. 高斯差分尺度空间生成 注:不同的尺度就是指不同的σσ\sigma,即不同的模糊(平滑)程度。2. 检测尺度空间极值点...原创 2017-08-26 11:47:33 · 907 阅读 · 0 评论 -
HOG特征简介
HOG(Histogram of Oriented Gradient),即方向梯度直方图,是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。其依据是所检测的局部物体外形能被光强梯度和边缘方向的分布所描述,本质就是梯度的统计信息,而梯度总是存在于图像的边缘(边缘是由图像中亮度变化明显的点组成的),HOG最经典的应用是在行人检测中。原创 2017-09-07 13:30:03 · 1499 阅读 · 0 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记四:中层视觉
中层视觉主要关注的是图像中的几何结构以及特定对象和目标,应用领域包括目标分割和跟踪。该篇的基本内容包括基于聚类的分割、基于模型拟合的分割和简单的跟踪介绍。原创 2017-09-24 11:19:13 · 1168 阅读 · 0 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记五:高层视觉
本篇介绍了《计算机视觉-一种现代方法》中的高层视觉的部分内容,包括图像配准和图像分类,着重介绍了图像分类中常用的一些图像特征和分类策略。原创 2017-10-15 11:35:34 · 1112 阅读 · 0 评论 -
《计算机视觉-一种现代方法(第2版)》读书笔记六:应用之图像搜索和检索
这是本系列的最后一篇读书笔记,针对计算机视觉在图像检索方面的应用进行了简单的介绍,图像检索属于信息检索的范畴,因此其检索方法借鉴了很多信息检索的基本技巧,如文档检索中的单词统计、最近邻估计和哈希技术等。个人以为图像检索未来的发展会朝着大规模、多种查询方式(基于内容的查询、基于语义的查询)、跨模态(以文搜图、以图搜文)等方向发展。原创 2017-11-04 12:13:27 · 678 阅读 · 0 评论 -
OpenCV2学习笔记一:基本图像容器Mat
知识大纲目的通过计算机将图像简化为数值矩阵以及矩阵信息。 Mat1.与OpenCV1的IplImage区别IplImage属于C语言的结构体,需要用户手动进行内存管理,即用到时为其开辟空间,在不需要时立即将空间释放。Mat属于C++的类,可以实现自动的内存管理(不严谨地说),为操作图像带来很大的方便。2.Mat组成矩阵头(信息头):原创 2017-06-02 11:29:42 · 657 阅读 · 0 评论 -
OpenCV Mat和IplImage的转换
IplImage是OpenCV1里面用于存储图像的数据结构,到了OpenCV2里面,这一结构被更方便易用的Mat类型取代。然而,在实际中,很多以前的OpenCV代码用的都是IplImage,因此进行Mat和IplImage的相互转换经常被用到,下面利用代码实现两者间的相互转换。IplImage转MatIplImage* iplimg_ptr = cvLoadImage("lena.原创 2017-08-24 17:43:31 · 805 阅读 · 0 评论