在这篇文章中,将尝试解释Computer Vision和OpenCV库的工作原理。在整篇文章中,将介绍:
什么是计算机视觉?
计算机视觉如何工作?
计算机视觉的应用
什么是OpenCV?
OpenCV的简史
OpenCV快速入门
让我们逐步开始。
资源:https : //medium.com/analytics-vidhya/introduction-to-computer-vision-with-opencv-part-1-3dc948521deb
什么是计算机视觉?
Computer Vision是一个工作场所,可让我们以数字方式检测图像并对这些图像执行操作。Computer Vision是一个人工智能工作区,在这里我们可以通过访问数字媒体中的图像特征来收集信息并提取特征。在其他来源中,其定义如下:
维基百科:
计算机视觉是一门跨学科的科学领域,涉及计算机如何从数字图像或视频中获得高级了解。从工程学的角度来看,它试图理解和自动化人类视觉系统可以完成的任务。
IBM:
计算机视觉是人工智能(AI)的领域,它使计算机和系统能够从数字图像,视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提出建议。如果AI使计算机能够思考,则计算机视觉使他们能够看到,观察和理解。
计算机视觉的主要目的是理解图像并解释它们以供我们使用。作为人类,我们可以用眼睛轻松感知任何街道上的移动物体。计算机使用许多不同的算法来理解这一点。但是,使用这些算法,计算机可能仍无法给出非常高精度的结果。
资源:https : //manningbooks.medium.com/how-does-computer-vision-work-bc35b0fb5df5
计算机视觉如何工作?
计算机使用某些算法来检测数字媒体中的图像。数字媒体中的图像由像素组成。任何图像中的像素都具有颜色和坐标。
想象一下,每个像素都有自己的标识。在其ID上,它写入坐标和颜色信息。这是计算机可以检测和识别图像的方式。
像素的坐标和颜色信息用数字表示。数字是根据RGB格式定义的。由于图像身份中的此信息是用数字表示的,因此计算机可以理解这一点。
每个图像可以包含数千个像素。这些像素也作为矩阵保留在图像上。因此,如果我们要在视觉上进行操作,则需要通过矩阵进行操作。
计算机视觉分为三个基本步骤:
1.获取图像
可以通过视频,照片或3D技术实时获取甚至大集合的图像进行分析。