什么是计算机视觉?
我个人的观点:
用一句话概括,就是让计算机拥有人能所见、人能所识、人能所思的能力,就可以称计算机拥有视觉,即计算机视觉。
人能所见,是指能看得见。对于计算机而言,是指能够获取图像。最常见的是通过摄像头来获取图像,所以摄像头这样的获取图像的设备,被称作计算机的眼睛。人能所识,是指人能够对看到的景象进行辨识,即回答,看到的是什么。对于计算机,这就是物体检测。人能所思,是指能够理解看到的景象有什么关联。举个例子,你看到一群人,你可以知道这群人正在干什么,或者将要干什么,又或者是刚干完什么,哪怕你看到的只是一张静止的图片。对计算机来说,就是让计算机理解图像之间的联系,或者是图像里不同物体间的联系。
所见,所识,所思,缺一不可,少一样都不能称之为完整的计算机视觉。必须三个能力同时达到,才能称为真正的计算机视觉。
百度百科的介绍为:
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人