介绍
众所周知,计算机视觉在机器学习和人工智能领域获得了巨大的普及。图像识别技术允许计算机处理比人眼更多的信息,通常更快、更准确,或者只是在人们不参与观看的情况下处理。因此,你可能想知道机器如何学习和解释视觉世界。
在本文中,我将介绍如何使用 Python 的 OpenCV 库开始处理图像和视频。我们将涵盖以下主题:
计算机视觉简介
OpenCV 库及其应用简介
如何使用 OpenCV 库处理图像和视频
计算机视觉
它是人工智能和计算机科学的一个领域,训练计算机理解视觉世界。它是机器学习的主要组成部分之一。它处理自然世界的图像(高维数据)。它执行各种任务,例如获取、分析和处理以理解图像并将其转换为数字或符号信息。
当今的计算机视觉算法基于模式识别,通常依赖于卷积神经网络 (CNN)。由于该领域的各种进步,计算机视觉正在蓬勃发展,并且它的受欢迎程度在过去几年中呈指数增长。
计算机视觉的应用范围从缺陷检测到入侵者检测、口罩检测到肿瘤检测、作物监测到植物监测、车辆分类到交通流量分析等。该技术主要应用于零售和制造、交通、媒体、农业、医疗保健、体育、银行、增强现实、家庭安全等。
OpenCV
Python 包含一个名为 OpenCV 的库,用于在计算机视觉领域工作。它是一个开源库,于 1999 年推出。我们可以执行图像处理、图像分析、视频分析等任务。该库主要用 C++ 编写,具有 C++、Python、Java 和 MATLAB 等接口。
应用:
2D 和 3D 特征工具包
视频/图像搜索检索
人脸识别系统
手势识别
移动机器人
对象识别
医学影像分析
运动追踪
增强现实
安装
使用 pip 命令可以轻松安装 OpenCV,如下所示
pip install opencv-python
使用 OpenCV 处理图像
在处理图像时,OpenCV 有许多可以对图像执行的操作。其中,我将讨论:
读取图像
调整图像大小
旋转图像
翻转图像
重写图像
裁剪图像
在图像上绘制各种形状
1. 从文件中读取图像
使用函数imread()读取图片 (支持BMP、jpeg、tiff、png、便携图片格式等)
为了显示我们在上一步中读取的图像,我们使用函数“imshow()”。这个函数的第一个参数是标题,第二个是我们读到的图像。
waitkey() 函数显示一个窗口几毫秒。毫秒数作为参数传递给函数。如果 0 作为参数传递,它将永远等待,直到按下任何键。
最后,destroyAllWindows() 将图像窗口显示后从内存中删除。