图像基本处理
文章平均质量分 61
YZXnuaa
乍见之欢不如久处不厌
展开
-
Faster RCNN原理分析 :Region Proposal Networks详解
缩进Region Proposal Networks是Faster RCNN出新提出来的proposal生成网络。其替代了之前RCNN和Fast RCNN中的selective search方法,将所有内容整合在一个网络中,大大提高了检测速度(语文水平差,所以历史科普请看其他文章T_T)。缩进在正文前,还要多解释几句基础知识,已经懂的看官老爷跳过就好。对于单通道图像+单卷积核做卷积,上原创 2018-01-31 19:23:34 · 14450 阅读 · 1 评论 -
【超分辨率】Laplacian Pyramid Networks(LapSRN)
期刊论文: https://arxiv.org/abs/1710.01992 会议论文CVPR2017: http://vllab.ucmerced.edu/wlai24/LapSRN/papers/cvpr17_LapSRN.pdf 项目主页:http://vllab.ucmerced.edu/wlai24/LapSRN/看了眼作者,Jia-Bin...转载 2018-03-19 16:53:26 · 1235 阅读 · 0 评论 -
【Pyhon】批量修改图片
运用Opencv解决# !/usr/bin/python# -*- coding: UTF-8 -*-import osimport cv2file_dir = '/home/ubuntu/图片/CAT_VS_DOGS_new/cat_dogs_record/cat'i = 0for file in os.listdir(file_dir): image = cv2.imr...原创 2018-03-06 15:12:04 · 263 阅读 · 0 评论 -
【python】数字图像处理:高级形态学处理 阈值分割+闭运算+连通区域标记+删除小区块+分色显示
形态学处理,除了最基本的膨胀、腐蚀、开/闭运算、黑/白帽处理外,还有一些更高级的运用,如凸包,连通区域标记,删除小块区域等。 1、凸包 凸包是指一个凸多边形,这个凸多边形将图片中所有的白色像素点都包含在内。 函数为: skimage.morphology.convex_hull_image(image) 输入为二值图像,输出一个逻辑二值图像。在凸包内的点为True, 否则为False 例: imp...转载 2018-03-23 19:51:06 · 6839 阅读 · 1 评论 -
【图像处理】Resize五种方法
最新版OpenCV2.4.7中,cv::resize函数有五种插值算法:最近邻、双线性、双三次、基于像素区域关系、兰索斯插值。下面用for循环代替cv::resize函数来说明其详细的插值实现过程,其中部分代码摘自于cv::resize函数中的源代码。每种插值算法的前部分代码是相同的,如下:[cpp] view plain copy cv::Mat matSrc, matDst1, matDst2...转载 2018-03-20 15:28:49 · 14375 阅读 · 0 评论 -
双线性插值
线性插值先讲一下线性插值:已知数据 (x0, y0) 与 (x1, y1),要计算 [x0, x1] 区间内某一位置 x 在直线上的y值(反过来也是一样,略):y−y0x−x0=y1−y0x1−x0y=x1−xx1−x0y0+x−x0x1−x0y1上面比较好理解吧,仔细看就是用x和x0,x1的距离作为一个权重,用于y0和y1的加权。双线性插值本质上就是在两个方向上做线性插值。双线性插值在数学上,双...转载 2018-03-20 15:30:04 · 318 阅读 · 0 评论 -
色彩特征提取-色彩属性HSV空间
看完颜色的物理和数学描述基础,再来分析颜色的哲学基础,颜色的人文语义属性。颜色的基本三属性为色相、明度和纯度。 来自于百科:色彩是通过眼、脑和我们的生活经验所产生的一种对光的视觉效应。人对颜色的感觉不仅仅由光的物理性质所决定,比如人类对颜色的感觉往往受到周围颜色的影响。有时人们也将物质产生不同颜色的物理特性直接称为颜色。 人眼对色彩的感知一般来源于来自于光源的直射色和...转载 2018-03-21 09:58:42 · 3464 阅读 · 0 评论 -
三维空间透视投影至二维平面
其实这篇文章讲的就是类似于MATLAB中的mesh函数的实现原理。想要实现的功能就是已知网格三维坐标,如何将转成在某个视角下的二维坐标。说白了就是如何将三维坐标用电脑呈现出来(因为电脑平面是二维的)。比如下面这些三维坐标点。 具体步骤主要分为三步骤: 1、选定观察点P(默认与x轴37度,与z轴30度,与原点距离(R)足够远)2、通过空间坐标变换,将原来的空间坐标系转换为以观察点为原点,PO为z轴的...原创 2018-03-26 16:36:13 · 14980 阅读 · 2 评论 -
直方均衡化
作者:王彦恒链接:https://www.zhihu.com/question/37204742/answer/221844779来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。为简化问题,仅讨论灰度图像的直方图均衡。设输入图像为二元函数 f(x, y) ,输出图像为二元函数 g(x, y),显然二者尺寸相等。我们知道,那些灰度值分布较为平均的图像,通常对比度较高。比...转载 2018-05-08 10:25:04 · 356 阅读 · 0 评论 -
【Python】霍夫线变换
在图片处理中,霍夫变换主要是用来检测图片中的几何形状,包括直线、圆、椭圆等。在skimage中,霍夫变换是放在tranform模块内,本篇主要讲解霍夫线变换。对于平面中的一条直线,在笛卡尔坐标系中,可用y=mx+b来表示,其中m为斜率,b为截距。但是如果直线是一条垂直线,则m为无穷大,所有通常我们在另一坐标系中表示直线,即极坐标系下的r=xcos(theta)+ysin(theta)。即可用(r,...转载 2018-03-19 16:07:03 · 689 阅读 · 0 评论 -
【YOLO】yolo.cfg文件 源码必备!
YOLO配置文件理解[net]batch=64 每batch个样本更新一次参数。subdivisions=8 如果内存不够大,将batch分割为subdivisions个子batch,每个子batch的大 小为batch/subdivisions。 ...转载 2018-03-01 15:16:37 · 5252 阅读 · 1 评论 -
Pascal VOC 数据集介绍
介绍Pascal VOC数据集:Challenge and tasks, 只介绍Detection与Segmentation相关内容。数据格式衡量方式voc2007, voc2012Challenge and tasks给定自然图片, 从中识别出特定物体。 待识别的物体有20类:personbird, cat, cow, dog, horse, sheepaeroplane, bicycle, b...转载 2018-03-08 11:22:11 · 780 阅读 · 0 评论 -
HSV
色调H用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°;饱和度S饱和度S表示颜色接近光谱色的程度。一种颜色,可以看成是某种光谱色与白色混合的结果。其中光谱色所占的比例愈大,颜色接近光谱色的程度就愈高,颜色的饱和度也就愈高。饱和度高,颜色则深而艳。光谱色的白光成转载 2018-02-01 17:22:31 · 1279 阅读 · 0 评论 -
YOLO9000
本次介绍一篇有关快速目标检测的文章《YOLO9000: Better, Faster, Stronger》。该方法记作YOLOv2,相比v1除了在性能上有所提升之外,更是在速度上表现惊人。项目主页:http://pjreddie.com/darknet/yolo/———————— Introduction ————————通用的目标检测不但要够快够准,还要能够检测多类的目标。但实际原创 2018-01-29 10:06:55 · 285 阅读 · 0 评论 -
目标检测任务中图片标注工具LabelImg等
原文地址:http://blog.csdn.net/jesse_mx/article/details/53606897转载 2018-02-05 11:16:37 · 1661 阅读 · 1 评论 -
RCNN 从region proposal到bounding box回归
网上很多关于Faster RCNN的介绍,不过这一片算是比较全的了,不仅包括整体流程、思想的介绍,也包括各个实现较为深入的介绍。大概内容记录如下(仅记录目前我感兴趣的部分):1 各种CNN模型以及数据库自从接触基于深度学习的目标检测这一领域以来,经常遇到各种CNN模型,比如ZF模型、VGG模型等等。同时也接触到各种数据集如PASCAL VOC、MNIST、ImageNet等等,博文深度学习原创 2018-01-29 17:43:17 · 1325 阅读 · 0 评论 -
神经网络 图像处理 KNN算法匹配 1
1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数据,对于新的数据则直接和训练数据匹配,如果存在相同属性的训练数据,则直接用它的分类来作为新数据的分类。这种方式有一个明显的缺点,那就是很可能无法找到完全匹配的训练记录。kNN算法则是从训练集中找到和新数据最接近的k条记原创 2018-01-30 10:32:39 · 4692 阅读 · 0 评论 -
计算机视觉 单应性 Homography
该博客内容发表在泡泡机器人公众号上,请尊重泡泡机器人公众号的版权声明在ORB-SLAM初始化的时候,作者提到,如果场景是平面,或者近似平面,或者低视差时,我们能应用单应性矩阵(homography),这三种情形在我应用SVO的过程中颇有同感,打破了我对H矩阵的固有映像,即只能用于平面或近似平面。但是我不知道如何去具体分析这里面的误差,比如不共面的情况时,应用H矩阵将一个图像坐标从图像1投影到图转载 2018-01-30 14:24:57 · 1337 阅读 · 0 评论 -
【图像处理】计算机视觉 透视变换 Perspective Transformation
透视变换(Perspective Transformation)是指利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。透视变换(Perspective Transformation)是将图片投影到一个新的视平面(Viewing Plane),也称作投影映射(P转载 2018-01-30 14:42:53 · 4102 阅读 · 0 评论 -
【OpenCV】CalcBackProject函数
反向投影目标本文档尝试解答如下问题:什么是反向投影,它可以实现什么功能?如何使用OpenCV函数 calcBackProject 计算反向投影?如何使用OpenCV函数 mixChannels 组合图像的不同通道?原理什么是反向投影?反向投影是一种记录给定图像中的像素点如何适应直方图模型像素分布的方式。简单的讲, 所谓反向投影就是首先计算某一特征的直方图模型,然后使用模型去寻找图像中存在的该特征。...转载 2018-02-08 10:35:17 · 898 阅读 · 0 评论 -
饱和度调整
之前在公司做项目的用到photoshop颜色空间的一些相关方法,在此总结一下。下面原理部分是从我的总结文档里截取来的。需要复制的童鞋自己手写一下~...原创 2018-09-05 00:17:30 · 1094 阅读 · 0 评论