![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 95
Belouga-
拂彼白石,弹吾素琴。幽涧愀兮流水深,善手明徽高张清。
展开
-
Faster RCNN 论文入门学习笔记
Faster RCNN(一) 整体框架(二) 网络结构2.1 Conv layers2.2 RPN(Region Proposal Networks):2.2.1 Anchors的生成规则2.3 RPN工作原理解析2.4 proposal2.5 roi_data(三) ROI Pooling(四) Classifier (一) 整体框架 整体介绍图中各层主要的功能 Conv layers提取特征图: 作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooli原创 2020-10-16 21:28:18 · 332 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 十 OPENCV
(一)OpenCV 的 Python 接口 Python 很强大,而且也有自己的图像处理库 PIL,但是相对于 OpenCV 来讲,它还是弱小很多。跟很多开源软件一样 OpenCV 也提供了 完善的 python 接口,非常便于调用。几乎任何一个能想到的成熟算法 都可以通过调用 OpenCV 的函数来实现,超级方便。 OpenCV 是一个C++ 库,它包含了计算机视觉领域的很多模块。除了 C++ 和 C, Python 作为一种简洁的脚本语言,在 C++ 代码基础上的 Python 接口得到了越来越广泛的支原创 2020-09-03 15:18:55 · 569 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 九 图像分割
图像分割是将一幅图像分割成有意义区域的过程。区域可以是图像的前景与背景或 图像中一些单独的对象。这些区域可以利用一些诸如颜色、边界或近邻相似性等特 征进行构建 (一)图割(Graph Cut) 图论中的图(graph)是由若干节点(有时也称顶点)和连接节点的边构成的集合。边可以是有向的或无向的,并且这些可能有与它们相关联的权重。 图割是将一个有向图分割成两个互不相交的集合,可以用来解决很多计算机视觉方 面的问题,诸如立体深度重建、图像拼接和图像分割等计算机视觉方面的不同问题。 从图像像素和像素的近邻创建一个原创 2020-09-01 20:20:05 · 650 阅读 · 1 评论 -
Python计算机视觉编程学习笔记 八 图像内容分类
(一)K邻近分类法 (KNN) 把待分类文本表示成文本向量,与训练样本组成的样本空间中的向量计算相似度,得到k篇与该文本距离最近(最相似)的文本,根据这k篇文本所属的类别判定新文本所属的类别,在新文本的k个邻居中依次计算每类的权重,将文本分到权重最大的类中。 KNN 是非参数的(non-parametric),基于实例(instance-based)的算法。非参数意味着其不在底层的数据分布上进行任何的臆测。而基于实例意味着其不是明确地学习一个模型,而是选择记忆训练的实例们。由于 KNN 是基于实例的算法,也原创 2020-08-19 21:18:56 · 406 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 七 图像搜索
(一)基于内容的图像检索 CBIR(Content-Based Image Retrieval,基于内容的图像检索) 定义 : 即从图像库中查找含有特定目标的图像,也包括从连续的视频图像中检索含有特定目标的视频片段。目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Colour)、纹理(Texture)、草图(Sketch)、形状(Shape)等,其中颜色、形状、纹理等应用尤为普遍。 ...原创 2020-08-15 20:03:28 · 509 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 六 图像聚类
(一)K-means聚类(K均值聚类) 定义:k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此,k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。 K-Means算法原理: 对给定的样本集,事先确定聚类簇数K,让簇内的样本尽可能紧密分布在一起,使簇间的距离尽可能大。该算法试图使集群数据分为n组独立数据样本原创 2020-08-09 14:20:23 · 674 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 五 多视图几何
(一)外极几何 如果有一个场景的两个视图以及视图中的对应图像点,那么根据照相机间的空间相对位置关系、照相机的性质以及三维场景点的位置,可以得到对这些图像点的一些几何关系约束。 外极几何是研究两幅图像之间存在的几何。它和场景结构无关,只依赖于摄像机的内外参数。研究这种几何可以用在图像匹配、三维重建方面。 介绍: ...原创 2020-08-07 10:25:11 · 592 阅读 · 1 评论 -
Python计算机视觉编程学习笔记 四 照相机模型与增强现实
本章将尝试对照相机进行建模,并有效地使用这些模型。在之前的章节里,已经讲述了图像到图像之间的映射和变换。为了处理三维图像和平面图像之间的映射,还需要在映射中加入部分照相机产生图像过程的投影特性。本章学习如何确定照相机的参数,以及在具体应用中,如增强现实,如何使用图像间的投影变换。 (一)针孔照相机模型 1.1 照相机模型 相机将三维世界中的坐标点映射到二维图像平面的过程能够用一个几何模型进行描述。这个模型有很多种,其中最简单的称为针孔模型。 在现实生活中,针孔相机是由前方有 一个小洞(针孔)所构成。现实世界原创 2020-08-03 17:15:46 · 676 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 三 图像到图像的映射
(一)单应性变换 单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里,平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性,比如图像配准、图像纠正和纹理扭曲,以及创建全景图像。 本质上, 单应性变换 H,按照下面的方程映射二维中的点(齐次坐标意义下): 对于图像平面内的点,齐次坐标是个非常有用的表示方法。点的齐次坐标是依赖于其尺度定义的, x=[x,y,w]=[αx,αy,αw]=[x/w,y/w,1]x=[x,y,w]=[αx,αy,αw]=[x/w,y/w,1]x=[x,y,原创 2020-07-31 22:00:42 · 657 阅读 · 0 评论 -
Python计算机视觉编程学习笔记 二 局部图像描述子
寻找图像间的对应点和对应区域。介绍用于图像匹配的两种局部描述子算法。图像的局部特征是许多计算机视觉算法的基础,使用特征点来代表图像的内容包括运动目标跟踪,物体识别,图像配准,全景图像拼接,三维重建等 ...原创 2020-07-28 16:27:31 · 441 阅读 · 0 评论