adchloe-CSDN博客

原创 Python计算机视觉编程——第8章图像内容分类

该算法将要分类的对象与训练集中已知类标记的所有对象进行对比，并由k近邻对指派到哪个类进行投票。该方法的弊端是：与k-means聚类算法一样，需要预先设定k值，k值得选择会影响分类得性能，而且这种方法要求将整个训练集存储起来，当训练集非常大，搜索会较慢。将定义得类对象添加到knn.py文件中。使用KNN方法，没有必要存储并将训练数据作为参数来传递。

2024-09-09 15:26:05 959

上述代码获得图像文件名和Numpy数组（包含在图像中找到的描述子）使用辅助函数is_indexed()检查图像是否已经索引，get_id()对一幅图像文件名给定id号。表单imlist包含索引的图像文件名，imwords包含单词的单词索引，用到了哪些词汇，单词出现在哪些图像，imhistograms包含了每幅图像的单词直方图。对图像进行索引是从这些图像中提取描述子，利用词汇将描述子转换为视觉单词，保存视觉单词及对应图像的单词直方图。返回的图像可以是颜色相似，纹理相似，图像中的物体或场景相似。

2024-09-08 11:05:33 1065

原创 Python计算机视觉编程——第六章图像聚类

聚类可以用于识别，划分图像数据集，组织与导航。

2024-09-03 15:30:42 1001

原创 Python计算机视觉编程——第五章多视图几何

如果有一个场景的两个视图以及视图中的对应图像点，那么根据照相机间的空间相对位置关系、照相机的性质以及三维场景点的位置，可以得到对这些图像点的一些几何关系约束。当照相机的位置如上设置，两幅图像具有相同的图像平面，图像的行是垂直对齐的，那么称图像对是经过矫正的。在不知道照相机内参数的情况下，仅能恢复照相机的投影变换矩阵。对于静止的图像，一个办法是找到一个中央参考视图，然后计算与之有关的所有其他照相机矩阵，另一个办法是计算一个图像对的照相机矩阵和三维重建，然后增量地加入新的图像和三维点。

2024-09-02 18:48:49 1354

原创 Python计算机视觉编程——第四章照相机模型与增强现实

针孔照相机模型是计算机视觉中广泛使用的照相机模型，该模型简单且具有足够的精确度。

2024-09-02 11:04:39 977

原创 Python计算机视觉编程——第三章图像到图像的映射

给定任意图像的标记点，通过将这些点进行三角剖分，然后使用仿射扭曲来扭曲每个三角形，可以将图像和另一幅图像的对应标记点扭曲对应。将扭曲的图像和第二幅图像融合，创建了alpha图像，该图像定义了每个像素从各个图像中获取的像素值成分多少。仿射扭曲的一个例子，将图像或者图像的一部分放置在另一幅图像中，使得它们能够和指定的区域或者标记物对齐。可以使用w=1来归一化点。在估计出图像间的单应性矩阵后，需要将所有的图像扭曲到一个公共的图像平面上。思想：创建一个很大的图像，使其和中心图像平行，然后将所有的图像扭曲到上面。

2024-08-27 14:09:22 1163

原创 Python计算机视觉编程——第二章局部图像描述子

第一个函数的参数为奇数大小长度的方形灰度图像块，该图像块的中心为处理的像素点。第二个函数使用归一化的互相关矩阵，将每个描述子匹配到另一个图像中的最优的候选点。SIFT描述子具有非常强的稳健性，SIFT特征对于尺度，旋转和亮度都具有不变性，可用于三维视角和噪声的可靠匹配。Harris角点检测算法是简单的角点检测算法，主要思想是，如果像素周围显示存在多于一个方向的边，认为该点为兴趣点，称为角点。对于将一幅图像中的特征匹配到另一幅图像的特征，一种稳健的准则是使用这两个特征距离和两个最匹配特征距离的比率。

2024-08-26 21:30:11 889

原创 Python计算机视觉编程——第一章基本的图像操作和处理

文章目录

2024-08-26 08:45:10 377

原创机器学习——第十四章概率图模型

使用变分法，最重要的是考虑如何对隐变量进行拆解，以及假设各变量子集服从何种分布，若隐变量的拆解或变量子集的分布假设不当，会导致变分法效率低，效果差。概率图模型是一类用图来表达变量相关关系的概率模型，图中用一个结点表示一个或一组随机变量，结点之间的边表示变量间的概率相关关系。该算法中，一个结点仅在接收到来自其他所有结点的消息后才能向另一个结点发送消息，且结点的边际分布正比于它所接收的消息的乘积，即。上图中的箭头表示了变量间的依赖关系，任一时刻，观测变量的取值仅依赖于状态变量，由马尔可夫链表示。

2024-08-19 20:40:48 1177

原创机器学习——第十二章计算学习理论

目录1 基础知识2 PAC学习3 有限假设空间3.1 可分情形3.2 不可分情形4 VC维5 Rademacher复杂度6 稳定性1 基础知识该理论研究的是关于通过计算来进行学习的理论，目的是分析学习任务的困难本质，为学习算法提供理论保证，并根据法分析结果指导算法设计。给定样例集D，假设χ\chiχ中的所有样本服从一个隐含未知的分布TTT,D中所有样本都是独立地从这个分布上采样而得。令h为χ到y\chi到yχ到y的一个映射，泛化误差为E(h;T)=Px∼T(h(x)≠y)E(h;T)=P_{x\s

2024-08-19 17:46:31 1118

原创机器学习——第十一章特征选择与稀疏学习

1.前向搜索：给定特征集合将每个特征看作一个候选子集，先对所有单特征子集进行评价，选定一个集，然后在上一轮的选定集加入一个特征，选出最佳特征子集。给定数据集D，对属性子集A，假定根据其取值将D分为了V个子集，每个子集中的样本在A上取值相同，计算属性子集A的信息增益。信息增益越大，特征子集A中包含的有助于分类的信息越多，可以通过计算信息增益来作为评价标准。2.后向搜索：从完整特征集合开始，每次尝试去掉一个无关特征，逐渐减少特征。从给定的特征集合中选择出相关特征子集的过程。没什么用的属性，与当前学习任务无关。

2024-08-17 20:04:45 665

原创机器学习——第十章降维与度量学习

2024-08-12 10:33:02 476

原创机器学习——第九章聚类

2024-08-11 18:50:29 153

原创机器学习——第五章神经网络

ART网络是竞争型学习的重要代表，由比较层，识别层，识别阈值和重置模块构成。训练过程：接受到训练样本，每个输出层神经元计算该样本与自身携带的权向量之间的距离，距离最近的神经元成为竞争获胜者（最佳匹配单元），最佳匹配单元及其邻近神经元的权向量被调整，使权向量与当前输入样本的距离缩小，上述过程不断迭代直到收敛。在这个模型中,神经元接收到来自几个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的值进行比较，然后通过激活函数处理以产生神经元的输出。

2024-08-04 21:19:38 988

原创机器学习——第八章集成学习

Stacking先从初始数据集训练出初级学习器,然后“生成”一个新数据集用于训练次级学习器.在这个新数据集中,初级学习器的输出被当作样例输入特征,而初始样本的标记仍被当作样例标记。对于无法接受带权样本的基学习算法，能过通过重采样法处理，即在每一轮学习中,根据样本分布对训练集重新进行采样,再用重采样而得的样本集对基学习器进行训练。要获得好的集成效果，个体学习器应该好而不同，个体学习器需要有一定的准确性和多样性。典型代表是Stacking，把个体学习器称为初级学习器，用于结合的学习器称为次级学习器或元学习器。

2024-08-02 21:35:24 626

原创机器学习——第七章贝叶斯分类器

贝叶斯网学习的首要任务就是根据训练数据集来找出结构最“恰当”的贝叶斯网.“评分搜索”是求解这一问题的常用办法.具体来说,我们先定义一个评分函数，以此来评估贝叶斯网与训练数据的契合程度,然后基于这个评分函数来寻找结构最优的贝叶斯网。贝叶斯学派则认为参数是未观察到的随机变量,其本身也可有分布,因此,可假定参数服从一个先验分布,然后基于观测到的数据来计算参数的后验分布。估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式,再基于训练样本对概率分布的参数进行估计.具体地,记关于类别c的类条件概率为。

2024-07-29 16:55:13 678

原创机器学习——第六章支持向量机

只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用.事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射φ.换言之,任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”的特征空间。对于如何求解对偶问题，这是一个二次规划问题,可使用通用的二次规划算法来求解;因此，提出了SMO算法。对于这个问题，可以将样本从原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性可分。找到具有最大间隔的划分超平面，就是找到约束下的参数w和b，使得。回带到L(w,b,a)中消去w和b，得到对偶问题。

2024-07-29 15:11:59 605

原创机器学习——第四章决策树

叶节点对应决策结果。将当前属性集合中每一个属性的信息增益计算处理挑选信息增益最大的属性来进行划分。属性中会有连续值，连续属性的可取值数目不再有限，不能直接使用连续属性的可取值来对结点进行划分。2.当前属性集为空（因为每一次分类都会剔除一个已经分类了的属性）或者所有样本再所有属性上的取值相同（所有样本再属性值上无区别，因此无法划分）。使用离散属性a进行划分时，会根据a有V个可能取值划分为V类，可以计算属性a对样本集D进行划分的信息增益。注意：当前结点划分属性为连续属性，该属性还可作为其后代结点的划分属性。

2024-07-26 15:14:48 935

原创机器学习——第三章线性模型

目录1 基本形式2 线性回归3 对数几率回归4 线性判别分析5 多分类学习6 类别不平衡问题1 基本形式线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数, 即f(x)=w1x1+w2x2+…+wdxd+bf(\boldsymbol{x})=w_{1} x_{1}+w_{2} x_{2}+\ldots+w_{d} x_{d}+bf(x)=w1x1+w2x2+…+wdxd+b,一般用向量形式写成f(x)=wTx+bf(\boldsymbol{x})=\bolds

2024-07-22 14:01:05 817

原创机器学习——第二章模型评估与选择

2024-07-22 10:30:01 414

原创机器学习——第一章绪论

示例或样本：关于一个事件或对象的描述，一个示例可以称为一个特征向量。通过计算的手段，利用经验改善系统自身性能。在计算机上从数据中参数模型的算法。属性或特征：反映事件或对象在某方面的表现或性质的事项。属性空间，样本空间，输入空间：属性张成的空间。假设：学得模型对应了关于数据的某种潜在的规律。学习或训练：从数据中学到模型的过程。训练数据：训练过程中使用的数据。训练样本：训练数据中的样本。训练集：训练样本组成的集合。真相或真实：潜在规律本身。属性值：属性上的取值。

2024-07-21 23:13:27 200

原创数字图像处理第十二章——目标识别

串描述适用于生成其结构是基于基元的简单连接，并且通常是和边界形状有关系的目标模式和其他实体模式。树的根表示整幅图像，按层次不断细分，直到达到我们在图像解析不同区域的能力的极限为止。根据一种预先定义的度量，将一个未知模式赋予最接近的类。最简单的方法是最小距离分类器，如其名称所示，最小距离分类器计算该未知模式与每个原型向量间的(欧氏)距离。由机器完成的模式识别是对不同的模式赋予不同类别的技术，这种技术是自动的，并且尽可能地减少人的干预。有两种基于串表示的边界形状的识别方法，串是结构模式识别中最实用的方法。

2024-07-15 22:29:59 619

原创数字图像处理第十一章——表示与描述

数字图像通常以一种网格形式来获取并处理，在这种网格形式中,x和y方向的间距相等，所以，链码可以通过追踪一个边界产生，也就是说，以顺时针方向，并且对连接每对像素的线段赋予一个方向的方法产生。这种方法通常是不可接受的，原因有二:(1)得到的链码往往太长，(2)噪声或不完美分割沿边界引起的任何较小干扰都会导致编码的变化，而这种变化与边界的主要形状特征可能是不相关的。对于一条闭合边界，当多边形的边数等于边界上的点数时，这种近似会变得很精确，此时，每对相邻的点定义了多边形的一条边。边界为B的区域R的MAT如下所示。

2024-07-15 21:47:50 898

原创数字图像处理第十章——图像分割

一阶导数的幅度可用于检测图像中的某个点处是否存在一个边缘，二阶导数的符号可用于确定一个边缘像素位于该边缘的暗的一侧还是亮的一侧。灰度的突然变化会在一阶导数中引起波峰或波谷，或在二阶导数中等效地引起零交叉。针对单色图像的分割算法基于处理灰度值的两类特性之一：不连续性和相似性。灰度变化与图像尺寸无关，检车要求使用不同尺寸的算子。灰度局部剧烈变化检测为基础的分割方法。台阶模型，斜坡模型，屋顶边缘模型。

2024-07-10 19:25:01 246

原创数字图像处理第九章——形态学图像处理

开操作一般会平滑物体的轮廓、断开较窄的狭颈并消除细的突出物。闭操作同样也会平滑轮廓的一部分，但与开操作相反，它通常会弥合较窄的间断和细长的沟壑，消除小的孔洞，填补轮线中的断裂。通俗来讲是一个用z平移的B包含在A中所有的点z的集合。B关于它的原点的映像，并且以z对映像进行平移为基础的。B对A的膨胀是所有位移z的集合。，B对A的开操作就是B对A的腐蚀，然后用B对结果进行膨胀。，B对A的闭操作就是B对A的膨胀，然后用B对结果进行腐蚀。结构元B对集合A的开操作，表示为。结构元B对集合A的闭操作，表示为。

2024-07-05 11:21:58 838

原创数字图像处理第八章——图像压缩

比特平面编码：将行程编码技术和基于符号的编码技术通过单独处理图像的比特平面的方法用于多余两级灰度的图像。基于符号的编码：一幅图像被表示为多幅频繁出现的子图像的一个集合，子图像被称为符号，通常是重复多次的字符位图，符号存储在一个符号字典中。解码或解压缩过程：解码器包含符号解码器和反映射器，以相反的顺序执行解码器的符号编码器和映射其的反操作，量化导致的不可逆的信息损失，所有没有反量化器。H0是黑色行程信源的熵的估计，H1是白色行程信源的熵的估计，L0是黑色行程的平均值，L1是白色行程的平均值。

2024-07-04 23:05:03 829

原创数字图像处理第六章——彩色图像处理

该模型中，每种颜色出现在红，率，蓝的原色光谱分量中。RGB彩色模型中表示的图像由三个分量图像组成，每种原色一幅分量图像。送入RGB监视器时，这三幅图像在屏幕上混合生成一幅合成彩色图像。该（色调，饱和度，强度）彩色模型描述对人来说是自然且直观的。是开发基于彩色描述的图像处理算法的理想工具。本质上，彩色模型是坐标系统和子空间的说明。CMYK在CMY的基础上加了黑色。CMY中使用青色，深红色和黄色。首先将所有彩色值归一化到范围。CMY和CMYK彩色模型。

2024-06-30 16:34:48 215

原创数字图像处理第五章——图像复原与重建

复原级数面向退化模型，采用相反的过程进行处理。

2024-06-30 15:46:58 1042

原创数字图像处理第四章——频率域滤波

频率域滤波由修改一幅图像的傅里叶变换然后计算其反变换得到处理后的结果组成。低频域图像中缓慢变化的灰度分量有关，高频由灰度的尖锐过度造成（边缘，噪声）。得出结论：空间域中两个函数的卷积的傅里叶变换等于两个函数的傅里叶变换在频率域中的乘积。两个变换的乘积可以通过机选傅里叶反变换得到空间域的卷积。二维内插应用之一是调整图像的大小，放大可看成过取样，缩小可看成欠取样。说明一个函数可以用变换来进行恢复，可以进行空间域和频率域的变换。取样特性的一种更为一般的说明涉及位于任意点。具有周期T的连续变量t的周期函数。

2024-06-30 10:25:32 757

adchloe的博客