slam基本知识总结

一、语义slam相关

图像分类(Image Classification)

表示根据图像中的主要内容对当前图片进行分类,给出了对于整张图片的描述。这一任务是最简单的图像内容识别任务,为其他高级任务提供了基础。此外,人脸识别、场景识别等都可归为图像分类任务。其输出为当前图像的类别。

目标检测(Object Detection)

表示对于一幅给定的图像中的各类目标进行识别并定位,需要完成两个任务,一是识别出物体,二是确定出该物体的位置。相比于图像分类,目标检测增加了对图片前景与背景的理解,需要从图像背景中提取出感兴趣的目标前景,并确定该目标的类别极其位置。目标检测的输出结果可以表示为一个列表,其中每一项包含检测出目标的类别及其位置(通常采用矩形框表示)。
*

语义分割(Semantic Segmentation)

**表示对一副给定的图像实现像素级别的分类,即令每个像素都分配给某个类别,属于图像前背景分离的扩展,将图片分割成为具有不同语义类别的部分。其输出结果通常为一幅包含每个像素点分类信息的
图像。

实例分割(Instance Segmentation)

表示对一幅给定图像进行目标检测,并描述目标的精确轮廓,可看作目标检测与语义分割的结合。相比于语义分割,实例分割赋予了目标实例的概念,相同类别的像素可按实例进行区分。其输出通常为一个列表,列表的每一项表明了目标的类别及其精确轮廓位置(像素级别的分割)。

二、其他相关知识

【1】 为什么需要齐次坐标?

齐次坐标就是将一个原本是n维的向量用一个n+1维向量来表示。 许多图形应用涉及到几何变换,主要包括平移、旋转、缩放。以矩阵表达式来计算这些变换时,平移是矩阵相加,旋转和缩放则是矩阵相乘,综合起来可以表示为 x=R∗X+t(注:因为习惯的原因,实际使用时一般使用变化矩阵左乘向量)(R 旋转缩放矩阵,t 为平移矩阵,X为原向量,x 为变换后的向量)。

引入齐次坐标的目的主要是合并矩阵运算中的乘法和加法,表示为x=P∗X的形式。即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值