一、场景描述
计算机视觉主要任务是通过对采集的图片或视频进行处理以获得相应场景的信息。通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。按照这种分类依据,计算机视觉主要分为以下几个方面:
- 物体检测,就是用框去标出物体的位置,并给出物体的类别;
- 物体识别,
- 图像分类
- 物体定位
- 图像分割
二、物体检测算法
图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。
https://www.jianshu.com/p/45acc16c6a94
论文:https://blog.csdn.net/hanzihan123/article/details/41483715
三、物体识别
计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。