一、语义slam相关
图像分类(Image Classification)
表示根据图像中的主要内容对当前图片进行分类,给出了对于整张图片的描述。这一任务是最简单的图像内容识别任务,为其他高级任务提供了基础。此外,人脸识别、场景识别等都可归为图像分类任务。其输出为当前图像的类别。
目标检测(Object Detection)
表示对于一幅给定的图像中的各类目标进行识别并定位,需要完成两个任务,一是识别出物体,二是确定出该物体的位置。相比于图像分类,目标检测增加了对图片前景与背景的理解,需要从图像背景中提取出感兴趣的目标前景,并确定该目标的类别极其位置。目标检测的输出结果可以表示为一个列表,其中每一项包含检测出目标的类别及其位置(通常采用矩形框表示)。
*
语义分割(Semantic Segmentation)
**表示对一副给定的图像实现像素级别的分类,即令每个像素都分配给某个类别,属于图像前背景分离的扩展,将图片分割成为具有不同语义类别的部分。其输出结果通常为一幅包含每个像素点分类信息的
图像。
实例分割(Instance Segmentation)
表示对一幅给定图像进行目标检测,并描述目标的精确轮廓,可看作目标检测与语义分割的结合。相比于语义分割,实例分割赋予了目标实例的概念,相同类别的像素可按实例进行区分。其输出通常为一个列表,列表的每一项表明了目标的类别及其精确轮廓位置(像素级别的分割)。
二、其他相关知识
【1】 为什么需要齐次坐标?
齐次坐标就是将一个原本是n维的向量用一个n+1维向量来表示。 许多图形应用涉及到几何变换,主要包括平移、旋转、缩放。以矩阵表达式来计算这些变换时,平移是矩阵相加,旋转和缩放则是矩阵相乘,综合起来可以表示为 x=R∗X+t(注:因为习惯的原因,实际使用时一般使用变化矩阵左乘向量)(R 旋转缩放矩阵,t 为平移矩阵,X为原向量,x 为变换后的向量)。
引入齐次坐标的目的主要是合并矩阵运算中的乘法和加法,表示为x=P∗X的形式。即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。