一只小小程序猿-CSDN博客

原创 Python计算机视觉编程第十章 OpenCV

Lucas-Kanade 跟踪算法可以应用于任何一种特征，不过通常使用一些角点，比如Harris 角点，角点是结构张量（Harris 矩阵）中有两个较大特征值的那些点，且更小的特征值要大于某个阈值。read() 方法解码并返回下一视频帧，第一个变量ret 是一个判断视频帧是否成功读入的标志，第二个变量则是实际读入的图像数组。在OpenCV 中，图像不是按传统的RGB 颜色通道，而是按BGR 顺序（即RGB 的倒序）存储的。读取图像时默认的是BGR，但是还有一些可用的转换函数。下面介绍几个基本示例。

2024-09-20 19:45:00 1331 2

原创 Python计算机视觉编程第九章图像分割

下一步我们创建图并分割。由于边的权重包含了距离部件，对于每个像素的特征向量，我们利用meshgrid() 函数来获取x 和y 值，然后该函数会在N 个像素上循环，并在N×N 归一化割矩阵W 中填充值。图割是将一个有向图分割成两个互不相交的集合，可以用来解决很多计算机视觉方面的问题，诸如立体深度重建、图像拼接和图像分割等计算机视觉方面的不同问题。右边的图像是通过上面的脚本生成的图线。在本节，我们将看到另外一种分割图像图的方法，即基于谱图理论的归一化分割算法，它将像素相似和空间近似结合起来对图像进行分割。

2024-09-20 11:25:55 1196

原创 Python计算机视觉编程第八章图像内容分类

9，以及一些什么也没有的单元格。我们会用已经剪切好的数独单元格数据集来训练一个10类的分类器2文件sudoku_images.zip中有两个文件夹“ocr data”和“sudokus”，后者包含了不同条件下的数独图像集，我们稍后讲解。SVM是一类强大的分类器，可以在很多分类问题中给出现有水准很高的分类结果，特别是当数据不是线性可分时。正确分类的点用星号表示，错误分类的点用圆点表示，曲线是分类器的决策边界。正确分类的点用星号表示，误错分类的点用圆点表示，曲线是分类器的决策边界。

2024-09-15 22:15:00 1313 2

原创 Python计算机视觉编程第七章图像搜索

CBIR是一种技术，通过直接分析图像的内容来检索图像，而不是依赖于元数据或关键词。

2024-09-15 15:48:32 1243

原创 Python计算机视觉编程第六章图像聚类

该算法首先将特征向量距离最近的两个样本归并为一组，并在树中创建一个“平均”节点，将这两个距离最近的样本作为该“平均”节点下的子节点；然后在剩下的包含任意平均节点的样本中寻找下一个最近的对，重复进行前面的操作。遍历整个树，通过设定的阈值，遍历过程可以在比阈值大的节点位置终止，从而提取出聚类簇。对于n个元素（如n幅图像），相似矩阵（或亲和矩阵，有时也称距离矩阵）是一个n×n 的矩阵，矩阵每个元素表示两两之间的相似性分数。左图用的是第一个和第二个主成分，右图用的是第二个和第三个主成分。

2024-09-15 09:15:00 912

原创 Python计算机视觉编程第五章多视图几何

下面是使用Matplottib工具包绘制的，牛津multi-view数据库中Mertoln1数据集的三维点：从上面和侧边观测的视图（左）；如果有一个场景的两个视图以及视图中的对应图像点，那么根据照相机间的空间相对位置关系、照相机的性质以及三维场景点的位置，可以得到对这些图像点的一些几何关系约束。上面的程序会加载前两个图像（共三个）、三个视图中的所有图像特征点1、对应不同视图图像点重建后的三维点以及照相机参数矩阵。基本的算法思想如下。上面的函数将x轴的范围作为直线的参数，因此直线超出图像边界的部分会被截断。

2024-09-14 21:01:15 955

原创 Python计算机视觉编程第四章照相机模型与增强现实

GL_MODELVIEW矩阵处理物体和照相机之间的三维变换关系，对应于我们照相机矩阵中的R和t部分。一个不同之处是，假设照相机为坐标系的中心，GL_MODELVIEW矩阵实际上包含了将物体放置在照相机前面的变换。,其中，R是描述照相机方向的旋转矩阵，t是描述照相机中心位置的三维平移向量，内标定矩阵K描述照相机的投影性质。如果图像中包含平面状的标记物体，并且已经对照相机进行了标定，那么我们可以计算出照相机的姿态（旋转和平移）。标定照相机的标准方法是，拍摄多幅平面棋盘模式的图像，然后进行处理计算。

2024-09-13 21:38:25 2325 1

原创 Python计算机视觉编程第三章图像到图像的映射

给定一个模型，例如点集之间的单应性矩阵，RANSAC基本的思想是，数据中包含正确的点和噪声点，合理的模型应该能够在描述正确数据点的同时摒弃噪声点。给定任意图像的标记点，通过将这些点进行三角剖分，然后使用仿射扭曲来扭曲每个三角形，我们可以将图像和另一幅图像的对应标记点扭曲对应。一种方法是创建一个很大的图像，比如图像中全部填充0，使其和中心图像平行，然后将所有的图像扭曲到上面。仿射扭曲的一个简单例子是，将图像或者图像的一部分放置在另一幅图像中，使得它们能够和指定的区域或者标记物对齐。

2024-09-13 15:57:08 1515 1

原创 Python计算机视觉编程第二章局部图像描述子

角点通常是图像中非常重要的特征点，因为它们能够提供丰富的信息用于后续的图像匹配、跟踪以及其他高级视觉任务。匹配描述子通常用于在不同图像之间找到对应的特征点。描述子是特征检测器提取出来的特征点的表示形式，通常是一串数值，用来描述该点周围的图像内容。Harris 角点检测器仅仅能够检测出图像中的兴趣点，但是没有给出通过比较图像间的兴趣点来寻找匹配角点的方法。我们首先通过图像间是否具有匹配的局部描述子来定义图像间的连接，然后可视化这些连接情况。兴趣点描述子是分配给兴趣点的一个向量，描述该点附近的图像的表观信息。

2024-09-13 10:00:58 1268

原创 Python计算机视觉编程第一章基本的图像操作和处理

图像去噪是在去除图像噪声的同时，尽可能地保留图像细节和结构的处理技术。在对图像做进一步处理之前，直方图均衡化通常是对图像灰度值进行归一化的一个非常好的方法，并且可以增强图像的对比度。假设所有的图像具有相同的大小，我们可以将这些图像简单地相加，然后除以图像的数目，来计算平均图像。相对于PIL来说，Matplotlib能绘制彩色图像而非灰度图像，其次，它可以表示出图像的具体x,y坐标，我们约定图像的左上角为坐标原点。上面图片是均衡化之前的灰度图，中间是均衡化之后的灰度图，最后是均衡化后的图像。

2024-09-12 17:02:06 913

原创机器学习第14章概率图模型

MRF 中的关键特性是局部马尔可夫性，这意味着任意一个节点的条件概率只依赖于其直接相邻的节点（邻居），而不依赖于图中的其他节点。这种方法的核心思想是通过一系列的求和操作来消除不感兴趣的变量，从而得到感兴趣的变量的边缘分布。所谓的生成模型，是指一篇文档中的每个词都是通过“文档以一定概率选择了某个主题，并从这个主题中以一定概率选择某个词语”的过程得到。条件随机场 (CRF) 是MRF的一种特殊情况，专门用于处理有监督的学习问题，即给定一些观测数据，预测一个或多个目标变量的值。

2024-09-12 09:15:00 2782

原创机器学习第12章计算学习理论

对。

2024-09-11 16:24:57 1495

原创机器学习第11章特征选择与稀疏学习

的误差，由于LVW算法中特征子集搜索采用了随机策略，而每次特征子集评价都需训练学习器，计算开销很大，因此算法设置了停止条件控制参数T。该统计量是一个向量，其每个分量分别对应于一个初始特征，而特征子集的重要性则是由子集中每个特征所对应的相关统计量分量之和来决定。总之，过滤式特征选择不考虑后续学习器的具体实现，它独立于学习算法，主要基于特征与目标之间的相关性来选择特征。"重构恢复"关注的是如何基于稀疏性从少量观测中恢复原信号，这是压缩感知的精髓，当我们谈到压缩感知时，通常是指该部分。

2024-09-11 15:32:05 1155

原创机器学习第10章降维与度量学习

事实上，在大多数情况下，我们观测或收集到的数据样本虽是高维的，但与学习任务密切相关的也许仅是某个低维分布，即高维空间中的一个低维"嵌入"。比如在上面图a中，样本点是三维空间中的S形曲面，此时若采用线性降维方法对三维空间观察到的样本点进行降维，则将丢失原本的低维结构。这通常涉及到学习一个映射函数，将数据点映射到一个新的空间中，使得在这个空间中，相似的数据点距离较近，而不相似的数据点距离较远。"流形"是在局部与欧氏空间同胚的空间，换言之，它在局部具有欧氏空间的性质，能用欧氏距离来进行距离计算。

2024-09-10 15:25:23 1192

原创机器学习第9章聚类

在每一轮选代中，算法随机选取一个有标记的训练样本，找出与其距离最近的原型向量，井根据两者的类别标记是否一致来对原型向量进行相应的更新。聚类是机器学习中一种重要的无监督学习方法，其目的是将数据集中的数据分成不同的聚类或组，使得同一簇内的样本尽可能相似，而不同簇的样本尽可能不同。DBSCAN是一种基于密度的聚类算法，它可以识别出任意形状的簇，并且不需要提前指定簇的数量。DBSCAN的核心思想是通过定义一个点的邻域，并根据邻域内的点密度来确定簇的边界。层次聚类的优点是可以直观地看到簇是如何逐步合并或分裂的。

2024-09-10 10:00:00 1048

原创机器学习第8章集成学习

次随机采样操作，我们得到含m个样本的采样集，照这样，我们可采样出T个含m个训练样本的采样集，然后基于每个采样集训练出一个基学习器，再将这些基学习器进行结合.）然后将它们的预测结果进行平均或投票来得到最终预测（ Bagging通常对分类任务使用简单投票法，对回归任务使用简单平均法）。Boosting是一族集成学习方法，通过顺序训练多个弱学习器，每个弱学习器都尝试修正前一个学习器的错误，从而逐步提高整体模型的性能。（3）从表示的方面来看，通过结合多个学习器，由于相应的假设空间有所扩大，有可能学得更好的近似。

2024-09-09 17:22:29 749

原创机器学习第7章贝叶斯分类器

最直接的做法是假设所有属性都依赖于同一个属性，称为“超父”，然后通过交叉验证等模型选择方法来确定超父属性，由此形成了SPODE方法。对分类任务来说，在所有相关概率都己知的理想情形下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。半朴素贝叶斯分类器的基本想法是适当考虑一部分属性问的相互依赖信息，从而既不需进行完全联合概率计算，又不至于彻底忽略了比较强的属性依赖关系。贝叶斯网，亦称“信念网”，，它借助有向无环图来刻画属性之间的依赖关系，并使用条件概率表来描述属性的联合概率分布。

2024-08-28 16:11:34 1019

原创机器学习第6章支持向量机

上式表明：只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用.事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射φ.换言之,任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”的特征空间。在该样本空间中，中间的"实线段"都可作为划分超平面，但它们的效果不尽相同。在现实任务中,原始样本空间内也许并不存在一个能正确划分两类样本的超平面，如下图中的" 异或问题就不是线性可分的。对这样的问题，可将样本从原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性分。

2024-08-25 12:24:17 2347

原创机器学习第5章神经网络

在生物神经网络中，每个神经元与其他神经元相连，当它"兴奋"时，就会向相连的神经元发送化学物质，从而改变这些神经元内的电位;在这个模型中，神经元接收到来自 η个其他神经元传递过来的输入信号，这些输入信号通过带权重的连接进行传递，神经元接收到的总输入值将与神经元的阀值进行比较，然后通过"激活函数"处理以产生神经元的输出。显然，识别阙值对ART网络的性能有重要影响.当识别阔值较高时，输入样本将会被分成比较多、比较精细的模式类，而如果识别阈值较低，则会产生比较少、比较粗略的模式。个隐层神经元所对应的中心和权重，

2024-08-23 17:26:54 1187

原创机器学习第4章决策树

决策树是一种强大的模型，适用于分类和回归任务。通过选择合适的划分标准、剪枝策略以及处理连续和缺失值的方法，可以有效提升模型的性能。多变量决策树提供了一种灵活的方式来利用多个特征进行划分，从而提高预测能力。

2024-08-19 10:46:06 643

原创机器学习第3章线性模型

线性模型试图学得一个通过属性的线性组合来进行预测的函数，即fxw1x1w2x2wdxdb,其中xi是x在第i个属性上的取值。一般采取向量形式表示上式，即fxwTxb,其中，ww1;w2;...;wd,只需确定w和b这两参数的值，该模型就已算确定了。

2024-08-13 16:45:34 698

原创机器学习第2章模型评估与选择

留出法是最简单的模型评估方法之一，它将原始数据集分为两部分：训练集和测试集。通常情况下，大约70%到80%的数据用于训练，剩下的20%到30%用于测试。

2024-08-10 22:26:17 1073 1

原创机器学习第1章绪论

机器学习所研究的主要内容，是关于在计算机上从数据中产生"模型" 的算法，即"学习算法"。有了学习算法，我们把经验数据提供给它，它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西瓜)，模型会给我们提供相应的判断(例如好瓜) .如果说计算机科学是研究关于"算法"的学问，那么类似的，可以说机器学习是研究关于"学习算法"的学问.

2024-08-08 20:35:16 141

原创数字图像处理（第三版）第12章目标识别

模式是描绘子的集合。在有关模式识别文献中经常使用来表示描绘子。模式类是指具有某些共同属性的一族模式。模式向量采用下列形式表示xx1x2⋮xn其中，每个分量xi表示第i个描绘子，n是与该模式有关的描绘子总数。如下例所示在某篇论文中，科研人员识别了三种鸢尾花，测量了它们花瓣的宽度和长度。不同花瓣宽度和长度不同，描绘它们的模式向量也不同，在选定了一组度量后，模式向量的分量成为每个物理样本的完整描述。

2024-08-04 11:29:31 704

原创数字图像处理（第三版）第11章表示和描述

从图像中分割出来的物体区域的表示和描述是大多数前期步骤。这些描述构成了后续学习的目标识别方法的输入。具体选择其中的哪一种方法，取决于考虑的问题，目的是为了捕获物体或物体类之间本质差异的描绘子，同时尽可能保留位置、大小和方向的独立性。

2024-08-03 11:56:45 983

原创数字图像处理（第三版）第10章图像分割

边缘像素是图像中灰度突变的那些像素，而边缘是连接的边缘像素的集合。边缘检测器是设计用来检测边缘像素的局部图像处理方法。

2024-08-02 12:11:48 1184

原创数字图像处理（第三版）第9章形态学图像处理

在二值图像中，集合是二维整数空间$Z^{2}的元素，在该空间中，集合的每个元素都是一个多元组，这些多元组的坐标是图像中某个像素的坐标（xy一个集合B的反射表示为\hat{B}，定义如下：$$如果B是描述图像中物体的像素集合，则B是B中坐标（x,y）被（-x,-y）代替的点的集合。下图显示了一个集合及其反射。

2024-08-01 11:16:41 256

原创数字图像处理（第三版）第8章图像压缩

数据压缩是指减少表示给定信息量所需数据量的处理，其中，数据是信息传递的手段，包含不相关或重复信息的表示称之为，即字面意思上的多余数据。用b比特表示的相对数据冗余R是R1−1/C，其中，C称为压缩率，其定义为Cbb′,在该式中，b通常是以二维灰度值阵列表示一幅图像所需的比特数。二维灰度阵列受如下三种类型的数据冗余的影响，分别是和。下面来逐一介绍。

2024-07-31 10:15:32 424

原创数字图像处理（第三版）第6章彩色图像处理

彩色图像处理可分为两个主要领域：全彩色处理和伪彩色处理。在第一类问题中，通常要求图像用全彩色传感器获取；第二类是对一种特定的单灰色度或灰度范围赋予一种颜色。

2024-07-07 22:30:38 755

原创数字图像处理（第三版）第5章图像复原与重建

退化的过程被建模为一个退化函数和一个加性噪声项，对一幅输入图像f(x,y)进行处理，产生一幅退化后的图像g(x,y).图像复原就是获取原始图像的一个估计f*(x,y)。这是最简单的滤波器，令Sxy表示中心在点（x,y）处，大小为mxn的矩形子图像窗口（邻域）的一组坐标。在周期噪声的情况下，由G(u,v)的谱来估计N(u,v)是可能的。频率特性是指傅里叶域中噪声的频率内容（即相对于电磁波谱的频率），当噪声的傅里叶谱是常量时，噪声通常称为白噪声。周期噪声的参数是通过检测图像的傅里叶谱来估计的。

2024-07-06 21:00:52 791

原创数字图像处理（第三版）第4章频率域滤波

这里写目录标题4.1基本概念4.1.1 复数4.1.2 傅里叶级数4.1.3 冲激及其取样特性4.1.4 连续变量函数的傅里叶变换4.1.5 卷积4.2 取样和取样函数的傅里叶变换4.2.1 取样4.2.2 取样函数的傅里叶变换4.2.3 取样定理4.2.4 混淆4.2.5 由取样后的数据重建（复原）函数4.3 单变量的离散傅里叶变换（DFT）4.4 两个变量的函数的扩展4.4.1 二维冲激及其取样特性4.4.2 二维连续傅里叶变换对4.4.3 二维取样和二维取样定理4.4.4 图像中的混淆4.4.5 二维

2024-07-06 08:45:21 369

qq_55871320的博客