计算机视觉与模式识别课程笔记——第一章

1、前言

1、1从人工智能到计算机视觉和模式识别

  • 让机器人像人一样看:计算机视觉
  • 让机器人像人一样听:自然语言理解和交流
  • 让机器人像人一样学习:机器学习
  • 让机器人像人一样思考:认知与推理、博弈与伦理
  • 让机器人一样运动:机器人

计算机视觉: 执行类似人类的视觉系统的任务,研究基于传感器感知数据如何分析和理解世界。
模式识别: 可以模拟人类的视觉和听觉系统,研究如何从传感器数据中自动识别出模式和规律

1、2计算机视觉可以做什么

  • 定位&重建
  • 分割&跟踪
  • 识别

2、基础知识准备

2、1传感器及其搭载平台

  1. 感知二维信息的传感器:面阵相机(手机、平板、相机),线阵相机(用于工业),鱼眼相机,全景相机。
  2. 感知三维信息的传感器:光学相机

计算机视觉领域搭载平台:手持、机器人、车载移动平台以及一些新兴平台。

2、2多视几何基础知识

齐次坐标

所谓齐次坐标就是将一个原本是n维的向量用一个n+1维向量来表示。
优点:

a:许多图形应用涉及到几何变换,主要包括平移、旋转、缩放。以矩阵表达式来计算这些变换时,平移是矩阵相加,旋转和缩放则是矩阵相乘,综合起来可以表示为p’= m1p+ m2(注:因为习惯的原因,实际使用时一般使用变化矩阵左乘向量)(m1旋转缩放矩阵, m2为平移矩阵, p为原向量 ,p’为变换后的向量)。引入齐次坐标的目的主要是合并矩阵运算中的乘法和加法,表示为p’ = pM的形式。即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。

b: 它可以表示无穷远的点。如果点(1,2)移动到无限远处,在笛卡尔坐标下它变为(∞,∞),然后它的齐次坐标表示为(1,2,0),因为(1/0, 2/0) = (∞,∞),我们可以不用”∞"来表示一个无穷远处的点了。

点线面的表示

: 笛卡尔坐标(x,y); 齐次坐标(sx,sy,s)
线: ax+by+c=0 或者齐次坐标下
在这里插入图片描述:ax+by+cz+d=0 或者齐次坐标下在这里插入图片描述
③角度表示

a: 二维空间角的表示
在二维空间中,旋转可以用一个单一的角 θ \theta θ定义(正角表示逆时针)
在这里插入图片描述

b:三维空间角的表示:

  1. 欧拉角和旋转矩阵
    欧拉角描述刚体在三维欧几里得空间的取向,表示坐标系相对参考坐标系𝑥𝑦𝑧的旋转角。
    刚体旋转的旋转矩阵可由三个欧拉角对应的三个基本旋转矩阵复合而成,以绕𝑦, 𝑥和𝑧轴依次旋转角度φ,ω和κ为例:
    在这里插入图片描述
    缺點:欧拉角表达方式不唯一;不平滑插值,参数空间不连续;产生万向节死锁现象。

  2. 旋转轴和旋转角
    单位向量e表示的旋转轴和绕旋转轴的旋转角 θ \theta θ,如下:
    在这里插入图片描述
    在这里插入图片描述

  3. 四元数

有三个虚部的复数:𝒒=𝑞_𝑤+𝒊𝑞_𝑥+𝒋𝑞_𝑦+𝒌𝑞_𝑧
=(𝑞_𝑤,𝑞_𝑥,𝑞_𝑦,𝑞_𝑧)
其中:
𝒊𝟐=𝒋𝟐=𝒌^𝟐=𝒊𝒌𝒋=−1
𝒊∙𝒋=𝒌
𝒋∙𝒊=−𝒌
优点:可减少减少计算量和存储空间;可避免万向节死锁;参数空间连续。

2、3常用优化方法和粗差处理方法

  1. 最小二乘(LS)
    a、线性最小二乘法
    b、非线性最小二乘法
  2. 最大似然( MLE )
  3. 最大后验( MAP )
  4. 粗差处理:最小中值法( LMedS )、RANSAC及其改进版本
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值