自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 Python计算机视觉编程 第三章 图像到图像的映射

给定一个模型,例如点集之间的单应性矩阵,RANSAC基本的思想是,数据中包含正确的点和噪声点,合理的模型应该能够在描述正确数据点的同时摒弃噪声点。给定任意图像的标记点,通过将这些点进行三角剖分,然后使用仿射扭曲来扭曲每个三角形,我们可以将图像和另一幅图像的对应标记点扭曲对应。一种方法是创建一个很大的图像,比如图像中全部填充0,使其和中心图像平行,然后将所有的图像扭曲到上面。仿射扭曲的一个简单例子是,将图像或者图像的一部分放置在另一幅图像中,使得它们能够和指定的区域或者标记物对齐。

2024-09-13 15:57:08 737

原创 Python计算机视觉编程 第二章 局部图像描述子

角点通常是图像中非常重要的特征点,因为它们能够提供丰富的信息用于后续的图像匹配、跟踪以及其他高级视觉任务。匹配描述子通常用于在不同图像之间找到对应的特征点。描述子是特征检测器提取出来的特征点的表示形式,通常是一串数值,用来描述该点周围的图像内容。Harris 角点检测器仅仅能够检测出图像中的兴趣点,但是没有给出通过比较图像间的兴趣点来寻找匹配角点的方法。我们首先通过图像间是否具有匹配的局部描述子来定义图像间的连接,然后可视化这些连接情况。兴趣点描述子是分配给兴趣点的一个向量,描述该点附近的图像的表观信息。

2024-09-13 10:00:58 672

原创 Python计算机视觉编程 第一章 基本的图像操作和处理

图像去噪是在去除图像噪声的同时,尽可能地保留图像细节和结构的处理技术。在对图像做进一步处理之前,直方图均衡化通常是对图像灰度值进行归一化的一个非常好的方法,并且可以增强图像的对比度。假设所有的图像具有相同的大小,我们可以将这些图像简单地相加,然后除以图像的数目,来计算平均图像。相对于PIL来说,Matplotlib能绘制彩色图像而非灰度图像,其次,它可以表示出图像的具体x,y坐标,我们约定图像的左上角为坐标原点。上面图片是均衡化之前的灰度图,中间是均衡化之后的灰度图,最后是均衡化后的图像。

2024-09-12 17:02:06 481

原创 机器学习 第14章 概率图模型

MRF 中的关键特性是局部马尔可夫性,这意味着任意一个节点的条件概率只依赖于其直接相邻的节点(邻居),而不依赖于图中的其他节点。这种方法的核心思想是通过一系列的求和操作来消除不感兴趣的变量,从而得到感兴趣的变量的边缘分布。所谓的生成模型,是指一篇文档中的每个词都是通过“文档以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”的过程得到。条件随机场 (CRF) 是MRF的一种特殊情况,专门用于处理有监督的学习问题,即给定一些观测数据,预测一个或多个目标变量的值。

2024-09-12 09:15:00 1288

原创 机器学习 第12章 计算学习理论

对。

2024-09-11 16:24:57 1025

原创 机器学习 第11章 特征选择与稀疏学习

的误差,由于LVW算法中特征子集搜索采用了随机策略,而每次特征子集评价都需训练学习器,计算开销很大,因此算法设置了停止条件控制参数T。该统计量是一个向量,其每个分量分别对应于一个初始特征,而特征子集的重要性则是由子集中每个特征所对应的相关统计量分量之和来决定。总之,过滤式特征选择不考虑后续学习器的具体实现,它独立于学习算法,主要基于特征与目标之间的相关性来选择特征。"重构恢复"关注的是如何基于稀疏性从少量观测中恢复原信号,这是压缩感知的精髓,当我们谈到压缩感知时,通常是指该部分。

2024-09-11 15:32:05 690

原创 机器学习 第10章 降维与度量学习

事实上,在大多数情况下,我们观测或收集到的数据样本虽是高维的,但与学习任务密切相关的也许仅是某个低维分布,即高维空间中的一个低维"嵌入"。比如在上面图a中,样本点是三维空间中的S形曲面,此时若采用线性降维方法对三维空间观察到的样本点进行降维,则将丢失原本的低维结构。这通常涉及到学习一个映射函数,将数据点映射到一个新的空间中,使得在这个空间中,相似的数据点距离较近,而不相似的数据点距离较远。"流形"是在局部与欧氏空间同胚的空间,换言之,它在局部具有欧氏空间的性质,能用欧氏距离来进行距离计算。

2024-09-10 15:25:23 1005

原创 机器学习 第9章 聚类

在每一轮选代中,算法随机选取一个有标记的训练样本,找出与其距离最近的原型向量,井根据两者的类别标记是否一致来对原型向量进行相应的更新。聚类是机器学习中一种重要的无监督学习方法,其目的是将数据集中的数据分成不同的聚类或组,使得同一簇内的样本尽可能相似,而不同簇的样本尽可能不同。DBSCAN是一种基于密度的聚类算法,它可以识别出任意形状的簇,并且不需要提前指定簇的数量。DBSCAN的核心思想是通过定义一个点的邻域,并根据邻域内的点密度来确定簇的边界。层次聚类的优点是可以直观地看到簇是如何逐步合并或分裂的。

2024-09-10 10:00:00 920

原创 机器学习 第8章 集成学习

次随机采样操作,我们得到含m个样本的采样集,照这样,我们可采样出T个含m个训练样本的采样集,然后基于每个采样集训练出一个基学习器,再将这些基学习器进行结合.)然后将它们的预测结果进行平均或投票来得到最终预测( Bagging通常对分类任务使用简单投票法,对回归任务使用简单平均法)。Boosting是一族集成学习方法,通过顺序训练多个弱学习器,每个弱学习器都尝试修正前一个学习器的错误,从而逐步提高整体模型的性能。(3)从表示的方面来看,通过结合多个学习器,由于相应的假设空间有所扩大,有可能学得更好的近似。

2024-09-09 17:22:29 573

原创 机器学习 第7章 贝叶斯分类器

最直接的做法是假设所有属性都依赖于同一个属性,称为“超父”,然后通过交叉验证等模型选择方法来确定超父属性,由此形成了SPODE方法。对分类任务来说,在所有相关概率都己知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。半朴素贝叶斯分类器的基本想法是适当考虑一部分属性问的相互依赖信息,从而既不需进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系。贝叶斯网,亦称“信念网”,,它借助有向无环图来刻画属性之间的依赖关系,并使用条件概率表来描述属性的联合概率分布。

2024-08-28 16:11:34 916

原创 机器学习 第6章 支持向量机

上式表明:只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用.事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射φ.换言之,任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”的特征空间。在该样本空间中,中间的"实线段"都可作为划分超平面,但它们的效果不尽相同。在现实任务中,原始样本空间内也许并不存在一个能正确划分两类样本的超平面,如下图中的" 异或 问题就不是线性可分的。对这样的问题,可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性分。

2024-08-25 12:24:17 1465

原创 机器学习 第5章 神经网络

在生物神经网络中,每个神经元与其他神经元相连,当它"兴奋"时,就会向相连的神经元发送化学物质,从而改变这些神经元内的电位;在这个模型中, 神经元接收到来自 η个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阀值进行比较,然后通过"激活函数"处理以产生神经元的输出。显然,识别阙值对ART网络的性能有重要影响.当识别阔值较高时,输入样本将会被分成比较多、比较精细的模式类,而如果识别阈值较低,则会产生比较少、比较粗略的模式。个隐层神经元所对应的中心和权重,

2024-08-23 17:26:54 1107

原创 机器学习 第4章 决策树

决策树是一种强大的模型,适用于分类和回归任务。通过选择合适的划分标准、剪枝策略以及处理连续和缺失值的方法,可以有效提升模型的性能。多变量决策树提供了一种灵活的方式来利用多个特征进行划分,从而提高预测能力。

2024-08-19 10:46:06 577

原创 机器学习 第3章 线性模型

线性模型试图学得一个通过属性的线性组合来进行预测的函数,即fxw1​x1​w2​x2​wd​xd​b,其中xi​是x在第i个属性上的取值。一般采取向量形式表示上式,即fxwTxb,其中,ww1​;w2​;...;wd​,只需确定w和b这两参数的值,该模型就已算确定了。

2024-08-13 16:45:34 664

原创 机器学习 第2章 模型评估与选择

留出法是最简单的模型评估方法之一,它将原始数据集分为两部分:训练集和测试集。通常情况下,大约70%到80%的数据用于训练,剩下的20%到30%用于测试。

2024-08-10 22:26:17 998

原创 机器学习 第1章 绪论

机器学习所研究的主要内容,是关于在计算机上从数据中产生"模型" 的算法,即"学习算法"。有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型;在面对新的情况时(例如看到一个没剖开的西瓜),模型会给我们提供相应的判断(例如好瓜) .如果说计算机科学是研究关于"算法"的学问,那么类似的,可以说机器学习是研究关于"学习算法"的学问.

2024-08-08 20:35:16 121

原创 数字图像处理(第三版)第12章 目标识别

模式是描绘子的集合。在有关模式识别文献中经常使用来表示描绘子。模式类是指具有某些共同属性的一族模式。模式向量采用下列形式表示x​x1​x2​⋮xn​​​其中,每个分量xi​表示第i个描绘子,n是与该模式有关的描绘子总数。如下例所示在某篇论文中,科研人员识别了三种鸢尾花,测量了它们花瓣的宽度和长度。不同花瓣宽度和长度不同,描绘它们的模式向量也不同,在选定了一组度量后,模式向量的分量成为每个物理样本的完整描述。

2024-08-04 11:29:31 656

原创 数字图像处理(第三版)第11章 表示和描述

从图像中分割出来的物体区域的表示和描述是大多数前期步骤。这些描述构成了后续学习的目标识别方法的输入。具体选择其中的哪一种方法,取决于考虑的问题,目的是为了捕获物体或物体类之间本质差异的描绘子,同时尽可能保留位置、大小和方向的独立性。

2024-08-03 11:56:45 798

原创 数字图像处理(第三版)第10章 图像分割

边缘像素是图像中灰度突变的那些像素,而边缘是连接的边缘像素的集合。边缘检测器是设计用来检测边缘像素的局部图像处理方法。

2024-08-02 12:11:48 1031

原创 数字图像处理(第三版)第9章 形态学图像处理

在二值图像中,集合是二维整数空间$Z^{2}的元素,在该空间中,集合的每个元素都是一个多元组,这些多元组的坐标是图像中某个像素的坐标(xy一个集合B的反射表示为\hat{B},定义如下:$$如果B是描述图像中物体的像素集合,则B是B中坐标(x,y)被(-x,-y)代替的点的集合。下图显示了一个集合及其反射。

2024-08-01 11:16:41 142

原创 数字图像处理(第三版)第8章 图像压缩

数据压缩是指减少表示给定信息量所需数据量的处理,其中,数据是信息传递的手段,包含不相关或重复信息的表示称之为,即字面意思上的多余数据。用b比特表示的相对数据冗余R是R1−1/C,其中,C称为压缩率,其定义为Cbb′,在该式中,b通常是以二维灰度值阵列表示一幅图像所需的比特数。二维灰度阵列受如下三种类型的数据冗余的影响,分别是和。下面来逐一介绍。

2024-07-31 10:15:32 328

原创 数字图像处理(第三版)第6章 彩色图像处理

彩色图像处理可分为两个主要领域:全彩色处理和伪彩色处理。在第一类问题中,通常要求图像用全彩色传感器获取;第二类是对一种特定的单灰色度或灰度范围赋予一种颜色。

2024-07-07 22:30:38 550

原创 数字图像处理(第三版)第5章 图像复原与重建

退化的过程被建模为一个退化函数和一个加性噪声项,对一幅输入图像f(x,y)进行处理,产生一幅退化后的图像g(x,y).图像复原就是获取原始图像的一个估计f*(x,y)。这是最简单的滤波器,令Sxy表示中心在点(x,y)处,大小为mxn的矩形子图像窗口(邻域)的一组坐标。在周期噪声的情况下,由G(u,v)的谱来估计N(u,v)是可能的。频率特性是指傅里叶域中噪声的频率内容(即相对于电磁波谱的频率),当噪声的傅里叶谱是常量时,噪声通常称为白噪声。周期噪声的参数是通过检测图像的傅里叶谱来估计的。

2024-07-06 21:00:52 669

原创 数字图像处理(第三版)第4章 频率域滤波

这里写目录标题4.1基本概念4.1.1 复数4.1.2 傅里叶级数4.1.3 冲激及其取样特性4.1.4 连续变量函数的傅里叶变换4.1.5 卷积4.2 取样和取样函数的傅里叶变换4.2.1 取样4.2.2 取样函数的傅里叶变换4.2.3 取样定理4.2.4 混淆4.2.5 由取样后的数据重建(复原)函数4.3 单变量的离散傅里叶变换(DFT)4.4 两个变量的函数的扩展4.4.1 二维冲激及其取样特性4.4.2 二维连续傅里叶变换对4.4.3 二维取样和二维取样定理4.4.4 图像中的混淆4.4.5 二维

2024-07-06 08:45:21 267

原创 数字图像处理(第三版)第3章 灰度变换与空间滤波

空间域就是简单的包含图像像素的平面,空间域技术直接在图像像素上操作。而对于频率域来说,其操作在图像的傅里叶变换上执行,而不针对图像本身。通常,空间域技术在计算上更有效,且需要更少的资源。本章空间域处理用下式表示:f(x,y)是输入图像,g(x,y)是处理后的图像,T是在点(x,y)的邻域上定义的关于f的一种算子。算子常用于单幅图像或图像集合。下图显示了其基本实现步骤点(x,y)是图像中的任意位置,周围的小区域是(x,y)的邻域,邻域是中心在(x,y)的矩形,尺寸很小。

2024-07-03 22:31:11 931

原创 数字图像处理(第三版)第2章 数字图像基础

包含一幅或多幅图像的阵列操作是以逐像素为基础执行的。考虑下面2x2图像:这两幅图像的阵列相乘是:这里主要介绍以前学过的集合间的基本运算:交 并 补逻辑操作:与 或 非。

2024-07-01 11:00:58 560

原创 数字图像处理(第三版)第1章 绪论

数字图像处理第一章个人入门学习心得体会

2024-06-30 23:03:44 576

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除