wastec-CSDN博客

原创 Python计算机视觉第十章-OpenCV

跟踪最基本的形式是跟随感兴趣点，比如角点。对此，一次流行的算法是 Lucas-Kanade 跟踪算法。光流是目标、场景或摄像机在连续两帧图像间运动时造成的目标的运动。它是图像在平移过程中的二维矢量场。相邻帧之间的时间足够短，以至于在考虑运行变化时可以忽略它们之间的差异。绿色线条表示跟踪的运动轨迹，红色圆点表示当前跟踪的角点。运行代码后，将打开一个窗口，显示视频中物体的跟踪效果。图像中目标的像素强度在连续帧之间不会发生变化。， Python 作为一种简洁的脚本语言，在。库，它包含了计算机视觉领域的很多模块。

2024-09-18 22:01:00 1237 1

原创 Python计算机视觉第九章-图像分割

该方法的基本思路是将图像表示为图，其中每个像素或像素区域作为一个节点，节点之间的边权表示它们的相似度。另外一种分割图像图的方法，即基于谱图理论的归一化分割算法，它将像素相似和空间近似结合起来对图像进行分割。在数学上，如果我们想找到使泛函J[u] 取极值的函数u，我们可以考虑泛函的变分（也就是其对函数的变化的导数）。图割是将一个有向图分割成两个互不相交的集合，可以用来解决很多计算机视觉方面的问题，诸如立体深度重建、图像拼接和图像分割等计算机视觉方面的不同问题。每个像素节点都有一个到汇点的传出边；

2024-09-13 16:42:18 1923

原创 Python计算机视觉第八章-图像内容分类

其基本思想是：给定一个待分类的样本点，根据距离度量（通常是欧氏距离），找到与该点距离最近的K个样本点，然后根据这些K个样本点的类别进行投票（分类）或平均（回归），以决定待分类样本点的类别或预测值。精确度表示正确分类为某类别的比例，召回率表示所有实际属于某类别的样本中被正确分类的比例，F1分数是精确度和召回率的调和平均数。准确率的值显示了模型对测试数据的分类准确程度，通常，准确率值越接近1.0，表示模型性能越好。，支持向量机）是一类强大的分类器，可以在很多分类问题中给出现有水准很高的分类结果。

2024-09-08 23:05:51 1722

原创 Python计算机视觉第七章-图像搜索

它的思想是将描述子空间量化成一些典型实例，并将图像中的每个描述子指派到其中的某个实例中。对图像进行几何特性排序通常涉及到提取图像的几何特征（如图像的面积、长宽比、边界框等），然后根据这些特征对图像进行排序。在大型图像数据库上，CBIR技术用于检索在视觉上具相似性的图像。下面是一个基本的实验代码示例，演示如何在数据库中添加图像，并进行分析和结果展示。在开始搜索之前，我们需要建立图像数据库和图像的视觉单词表示。中处理问题，使在数百万图像中搜索具有相似内容的图像成为可能。下面是在数据库中搜索图像的实验。

2024-09-08 12:58:08 2506

原创 Python计算机视觉第六章-图像聚类

我们可以将图像的每个像素点的颜色特征（通常是 RGB 颜色值）作为特征向量输入到 K-means 算法中，然后通过 K-means 聚类将这些像素点分成几个簇。层次聚类有若干优点。通过上述实验，可以观察到K-means算法如何将数据点分成不同的簇，并计算每个簇的质心。：在此实验中，我们将图像的每个像素表示为一个 RGB 颜色值，并将这些值作为 K-means 的输入。K-means是一种常见的聚类算法，其主要目标是将数据点分配到预定数量的簇中，使得簇内的数据点尽可能相似，而簇间的数据点尽可能不同。

2024-09-02 15:45:33 3257

原创 Python计算机视觉第五章-多视图几何

5.1外极几何多视图几何是利用在不同视点所拍摄图像间的关系，来研究照相机之间或者特征之间关系的一门科学。图像的特征通常是兴趣点，本章使用的也是兴趣点特征。多视图几何中最重要的内容是双视图几何。如果有一个场景的两个视图以及视图中的对应图像点，那么根据照相机间的空间相对位置关系、照相机的性质以及三维场景点的位置，可以得到对这些图像点的一些几何关系约束。我们通过外极几何来描述这些几何关系。

2024-09-02 14:04:28 1495

原创 Python计算机视觉第四章-照相机模型与增强现实

为了使用 RQ 因子分解对照相机矩阵进行分解，我们需要将一个摄像机投影矩阵 PP 分解为两个矩阵的乘积：P=RQP=RQ，其中 RR 是旋转矩阵，QQ 是内参矩阵。要将标定好的照相机参数转换为 OpenGL 中的投影矩阵，可以使用以下步骤。首先，我们需要从照相机矩阵中提取投影矩阵的参数，然后将其转换为 OpenGL 可以接受的格式。）是将物体和相应信息放置在图像数据上的一系列操作的总称。RQ 分解帮助将投影矩阵分解为内参矩阵和外参矩阵，从而可以深入了解相机的内部结构和其在世界坐标系中的位置。

2024-09-01 22:22:37 2955 2

原创 Python计算机视觉第三章-图像到图像的映射

给定任意图像的标记点，通过将这些点进行三角剖分，然后使用仿射扭曲来扭曲每个三角形，我们可以将图像和另一幅图像的对应标记点扭曲对应。仿射扭曲的一个简单例子是，将图像或者图像的一部分放置在另一幅图像中，使得它们能够和指定的区域或者标记物对齐。基本的思想是，数据中包含正确的点和噪声点，合理的模型应该能够在描述正确数据点的同时摒弃噪声点。函数对原始图像应用计算出的单应性矩阵，进行透视变换，使得图像对齐到目标图像的视角。：利用计算得到的单应性矩阵对图像进行透视变换，使得源图像对齐到目标图像的视角。

2024-08-26 14:42:18 1501

原创 Python计算机视觉第二章-局部图像描述子

根据Lowe的比率测试法，只保留那些第一个匹配距离明显小于第二个匹配距离的特征点对。此方法通过设置比率阈值（通常为0.75），降低了错误匹配的数量，确保了匹配的准确性。对于将一幅图像中的特征匹配到另一幅图像的特征，一种稳健的准则（同样是由 Lowe 提出的）是使用这两个特征距离和两个最匹配特征距离的比率。该算法的主要思想是，如果像素周围显示存在多于一个方向的边，我们认为该点为兴趣点。：使用SIFT检测图像中的特征点并计算其描述子，SIFT能够提供旋转和尺度不变性。描述子使用主方向描述参考方向。

2024-08-26 13:29:50 814

原创 Python计算机视觉第一章-基本的图像操作和处理

图像平均操作是减少图像噪声的一种简单方式，通常用于艺术特效。SciPy 提供很多高效的操作，可以实现数值积分、优化、统计、信号处理，以及对我们来说最重要的图像处理功能。图像去噪是在去除图像噪声的同时，尽可能地保留图像细节和结构的处理技术。科学计算工具包，其中包含了大量有用的思想，比如数组对象（用来表示向量、矩阵、图像等）以及线性代数函数。因为绘制轮廓需要对每个坐标 [写一个简单的用于图像缩放的函数。Matplotlib是个很好的类库，具有比 PIL 更强大的绘图功能。一个简单的例子就是图像的灰度变换。

2024-08-26 12:06:11 817

原创机器学习第十四章-概率图模型

14.1隐马尔可夫模型14.1隐马尔可夫模型概率围棋型是一类用图来表达变量相关关系的概率模型.它以图为表示工具，最常见的是用一个结点表示一个或一组随机变量，结点之间的边表示变量间的概率相关关系，即"变量关系图”。隐马尔可夫模型是结构最筒单的动态贝叶斯网，这是一种著名的有向图模型，主要用于时序数据建模，在语音识别、自然语言处理等领域有广泛应用。

2024-08-19 22:41:50 1303 1

原创机器学习第十二章-计算学习理论

VC维是衡量一个假设空间复杂度的指标，它反映了假设空间能够打散的最大样本集的大小。即，如果假设空间 H 能打散大小为 d 的样本集，但不能打散大小为 d+1 的样本集，那么 H 的VC维就是 d。打分是一个与增长函数紧密相关的概念。具体来说：一个假设空间 (H )能打分一个样本集 S （大小为 m，如果 H 中的假设可以对 S 中的每一种可能的标签分配进行匹配。现实学习任务所面临的通常是无限假设空间，欲对此种情形的可学习性进行研究，需度量假设空间的复杂度.最常见的办法是考虑假设空间的 "VC维"。

2024-08-19 16:35:53 1433

原创机器学习第十一章-特征选择与稀疏学习

11.1子集收集与评价11.1子集收集与评价属性称为"特征"，对当前学习任务有用的属性称为"相关特征"、没什么用的属性称为"无关特征"从给定的特征集合中选择出相关特征于集的过程，称为"特征选择"。特征选择是一个重要的"数据预处理" 过程。我们要从初始的特征集合中选取一个包含了所有重要信息的特征子集，首先，是子集搜索，给走特征集合 {a1，a2 ，... ad} ，我们可将每个特征看作一个候选子集，对这d个候选单特征子集进行评价，假定 {a2}最优，于是将{a。

2024-08-18 23:05:23 1185 1

原创机器学习第十章-降维与度量学习

K近邻学习是一种简单的监督学习算法，用于分类和回归任务。：存储训练数据及其标签，没有显式的训练过程。给定测试样本 x，若其最近邻样本为z 则最近邻分类器出错的概率就是x与z类别标记不同的概率，即：10.2低维嵌入在高维情形下出现的数据样本稀疏、距离计算困难等问是所有机器学习方法共同面的严重障碍，被称为"维数灾难"。

2024-08-12 17:33:52 1019

原创机器学习第九章-聚类

在"无监督学习"中研究最多、应用最广的是"聚类" .聚类试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个"簇" .聚类过程仅能自动形成簇结构，簇所对应的概念语义需由使用者来把握和命名。聚类的结果可用包含m个元素的簇标记向量 λ=(λ1;λ2;...;λm) 表示.9.2性能度量聚类性能度量亦称聚类"有效性指标"聚类性能度量大致有两类. 一类是将聚类结果与某个"参考模型"进行比较，称为"外部指标";另一类是直接考察聚类结果而不利用任何参考模型，称为"内部指标"。

2024-08-12 16:27:26 1179

原创机器学习第八章-集成学习

Boosting 是一族可将弱学习器提升为强学习器的算法.:先从初始训练集训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多关注，然后基于调整后的样本分布来训练下一个基学习器;集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能.这对“弱学习器”尤为明显,但在现实中，为了得到更好的结果，通常使用较强的学习器。成中只包含一个基学习器时这很容易理解，因为通过引入属性扰动，随机森林中个体学习器的性能往往有所降低。

2024-08-05 17:48:50 665

原创机器学习第五章-神经网络

基于梯度的搜索是使用最广泛的参数寻优方法，梯度下降法的主要思想就是沿着负梯度方向去搜索最优解，负梯度方向是函数值下降最快的方向，若迭代到某处的梯度为0，则表示达到一个局部最小，参数更新停止。感知机只有输出层神经元进行激活函数处理，即只拥有一层功能神经元，其学习能力非常有限.所以应该采用多层功能神经元，如下图所示，输出层与输入层之间有一层神经元，被称为隐居或隐含层，隐含层和输出层神经元都是拥有激活函数的功能神经元.误差逆传播算法是更强大的学习算法，BP算法基于梯度下降策略，以目标的负梯度方向对参数进行调整。

2024-08-05 15:23:33 1518 2

原创机器学习第七章-贝叶斯分类器

贝叶斯网学习的首要任务就是根据训练数据集来找出结构最“恰当”的贝叶斯网.“评分搜索”是求解这一问题的常用办法.具体来说,我们先定义一个评分函数，以此来评估贝叶斯网与训练数据的契合程度,然后基于这个评分函数来寻找结构最优的贝叶斯网。估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布的参数进行估计.事实上，概率模型的训练过程就是参数估计的。为如何确定每个属性的父属性，不同的做法产生不同的独依赖分类器。类样本组成的集合，假设这些样本是独立同分布的，则参数 θc。

2024-07-30 01:56:06 738

原创机器学习第六章-支持向量机

对样本(x,y)，传统回归模型通常直接基于模型输出f(x)与真实输出y yy之间的差别来计算损失，当且仅当f(x)与y完全相同时，损失才为零。与此不同，支持向量回归假设我们能容忍f ( x ) f(x)f(x)与y yy之间最多有ϵ的偏差，即仅当f(x)与y yy之间的差别绝对值大于ϵ时才计算损失。如图 6.6所示，这相当于以f(x)为中心，构建了一个宽度为 2ϵ的间隔带，若训练样本落入此间隔带，则认为是被预测正确的。SMO先选取违背KKT条件程度最大的变量．使选取的两变量所对应样本之间的间隔最大.

2024-07-30 01:03:00 1008

原创机器学习第四章-决策树

由于连续属性的可取值数目不再有限，因此，不能直接根据连续属性的可取值来对结进行划分.此时，连续属性离散化技术可派上用场最简单的策略是采用二分法对连续属性进行处理，这正 C4.5 决策树算法中采用的机制。后剪枝则是先从训练集生成一棵完整的决策树，然后自底向上地对非叶结点进行考察，若将该结点对应的子树替换为叶结点能带来决策树泛化性能提升，则将该子树替换为叶结点.给定样本集D和连续属性a，取a的中位点作为候选划分点，然后，我们就可像离散属性值一样来考察这些划分点，选取最优的划分点进行样本集合的划分。

2024-07-29 23:02:17 1111

原创机器学习第三章-线性模型

因此，需要使用更合适的评估指标如精确率（Precision）、召回率（Recall）、F1分数等来评估模型在不同类别上的表现。个类别C1,C2,C3.....,CN多分类学习的基本思路是 "拆解法飞即将多分类任务拆为若干个二分类任务求解.具体来说，先对问题进行拆分，然后为拆出的每个二分类任务训练一个分类器;例如，在医疗诊断中，罕见病的患者比例可能非常低，而正常人的比例较高。5.层级分类：将多个少数类别合并为一个类别，从而减少类别的数量，使得问题变得更平衡。是每次将若干个类作为正类，若干个其他类作为反类.

2024-07-22 21:48:37 1080

原创机器学习第二章-模型评估与选择

2.1经验误差与过拟合分类错误的样本数占样本总数的比例称为"错误率"，在m个样本中有a个样本分类错误，则错误率 E= a/m;1-a/m为精度。学习器的实际预测输出与样本的真实输出之间的差异称为"误差"，学习器在训练集上的误差称为"训练误差"，，在新样本上的误差称为"泛化误差"。当学习器把训练样本学得"太好"了的时候，很可能巳经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这样就会导致泛化性能下降，这种现象在机器学习中称为 "过拟合"。2.2评估方法测试集测试。

2024-07-22 21:04:16 1055

原创机器学习第一章-机器学习基础

为了评估算法，必须测试算法工作的效果。如果使用无监督学习算法，由于不存在目标变量值，故而也不需要训练算法，所有与算法相关的内容都集中在第5步。的另一项任务是回归，它主要用于预测数值型数据，如：数据拟合曲线：通过给定数据点的最优拟合曲线。获取样本数据方法很多，如制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得到数据、设备发送过来的实测数据等、公开可用的数据源等。机器学习是一种通过让计算机系统从数据中学习模式和规律，从而自动改善性能和行为的技术，适用于各种领域，包括预测、识别、决策和自动化任务。

2024-07-20 18:18:04 828

原创数字图像处理第12章-目标识别

这种方法通常用于解决具有连续特征的分类问题，其中每个样本都由三个特征组成，可以表示为 ( (x_1, x_2, x_3) )，其中 ( x_1, x_2, x_3 ) 分别表示三个特征的取值。我们把每个模式类的原型定义为该类模式的平均向量：。为了比较根据形状数描述的区域边界，我们可以明确表达一个过程，例如，令a和b代表由4方向链码表示的闭合边界的形状数。

2024-07-15 15:50:07 724

原创数字图像处理第十一章-表示和描述

边界B直径定义为：。当这种条件出现时，存储该直线的参数，将误差设为零，并且重复该过程，沿边界聚合新的点，直到该误差再次超过预设的阈值。其核心思想是寻找在不同尺度下稳定的极值区域，即稳定的极值区域应在不同的尺度空间下有相似的形状和大小。

2024-07-15 14:13:05 915

原创数字图像处理第十章-图像分割

在图像分割中，基本的挑战是将一幅图像划分为多个区域，这些区域需满足特定的条件。通常情况下，针对单色图像的分割算法会依据灰度值的两种主要特性之一：不连续性和相似性。在第一种特性中，假设各个区域的边界与背景明显不同，允许基于灰度的局部不连续性来检测边界，这种方法主要采用基于边缘的分割技术。而第二种特性则使用基于区域的分割方法，依据预先定义的一组标准将图像分割成相似的区域。

2024-07-14 16:21:49 1091

原创数字图像处理第九章-形态学图像处理

连通性定义了像素之间的连接方式，通常包括4邻域连接（上下左右）或8邻域连接（包括对角线方向）。这决定了哪些像素可以被视为同一连通分量的一部分。

2024-07-07 18:45:12 1131

原创数字图像处理第八章-图像压缩

基本思想是通过建立符号与编码之间的映射关系，使得出现频率较高的符号可以用较短的编码来表示，而出现频率较低的符号则用更长的编码来表示。给定一个非负整数n和一个正整数除数m>0后，表示为Gm(n)的n关于m的Golomb编码是商[n/m]的一元编码和n mod m的二进制表示的一个合并。}的集合来编码，其中，每个(x,y)对规定了图像中一个符号的位置，从而压缩整个图像。它通过使用不同长度的编码来表示不同符号，使得出现频率高的符号用较短的编码表示，频率低的符号用较长的编码表示，从而达到有效压缩数据的目的。

2024-07-06 17:54:32 757

原创数字图像处理第六章-彩色图像处理

通常，彩色图像的噪声内容在每个彩色通道中具有相同的特性，但噪声对不同的彩色通道所造成的影响不同。对于前几节中描述的RGB,CMY(K)和HSI图像，任何压缩对象的数据是每个彩色像素的分量(即RGB图像中各像素的红、绿、蓝分量);图6.46(c)显示了由计算每幅RGB分量图像的梯度，并通过在每一坐标点(x,y)处叠加相应的3幅分量图像的值所形成的一幅合成的梯度图像。其中f(x,y)是彩色输入图像，g(x,y)是变换后或处理过的彩色输出图像，T是在(x,y)的空间邻域上对f的一个算子。

2024-06-30 20:08:52 945

原创数字图像处理第五章-图像复原与重建

其约束为：。使用与获取退化图像的设备相似的装置，从理论上讲，得到一个准确的退化估计是可能的，一个冲激可由一个亮点来模拟，该点应尽可能亮，以便将噪声的影响降低到可以忽略的程度。均值给出了在其上计算均值的区域中的平均灰度的度量，而方差则给出了该区域的对比度的度量。

2024-06-30 14:49:51 822

原创数字图像处理第四章-频率域滤波

图4.6(a)是函数f(t)的傅里叶变换F(μ)的简图，图4.6(b)显示了取样后的函数的变换F(μ)。如果t表示的是以米为单位的距离，则μ的单位是周/米，等等。是IDFT,F(u,v)是输入图像f(x,y)的DFT,H(u,v)是滤波函数(也简称为滤波器，或者滤波传递函数),g(x,y)是滤波后的(输出)图像。如在一维情况中那样，二维傅里叶变换及其反变换在u方向和v方向是无限周期的，即 F(u,v)=F(u+k₁M,v)=F(u,v+k₂N)=F(u+k₁M,v+k₂N)

2024-06-29 23:36:21 1429 1

原创数字与图像处理第三章-灰度变换与空间滤波

图3.45(a)显示了一幅图像，由于该图像的灰度只占灰度级很窄的范围[见图3.55(a)中的直方图],给出的是一幅低对比度外观的图像。在输出项中，我们可以将“较暗”考虑为暗灰度值的程度(100%的黑是暗色调的极限值),将“较亮”考虑为亮色调的程度(100%的白是极限值),将“灰的”视为中间灰度级中灰度的程度。这里，所谓的“程度”是一种特定灰度的数量。统计排序滤波器是一种非线性空间滤波器，这种滤波器的响应以滤波器包围的图像区域中所包含的像素的排序(排队)为基础，然后使用统计排序结果决定的值代替中心像素的值。

2024-06-23 23:39:47 935

原创数字图像处理第二章-数字图像基础

当我们谈到一幅图像的求幂时，意味着每个像素均进行求幂操作；当我们谈到一幅图像除以另一幅图像时，意味着在相应的像素对之间进行相除，等等。

2024-06-23 17:02:21 828

原创数字图像处理第一章

一幅图像我们可把它定义为一个二维函数f(x,y)，其中x和y是空间（平面）坐标。任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或者灰度。当x,y和灰度值f是有限的离散数值时，我们称该图像为数字图像。数字图像处理指用借助计算机来处理数字图像，图像中的元素称为像素。图像处理到计算机视觉这个连续的统一体中我们会考虑三种典型的计算处理，即低级、中级和高级处理。低级处理涉及初级操作，如降低噪声的图像预处理，对比度增强和图像尖锐化。低级处理以输入输出都是图像为特征。

2024-06-23 12:29:32 843 1

wastec的博客