前面介绍了Numpy模块,下面再介绍一个OpenCV模块,就基于这两个库看一下当下很火的人工智能是如何实现的,我们介绍几个:人脸识别(当下非常火的)、音视频操作等等。今天先介绍一下静态图片的人脸识别,后面再介绍动态视频以及摄像头中的人脸识别。
一、OpenCV介绍OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。
OpenCV-Python是OpenCV的PythonAPI,集成了Python语言和C++语言的最优特征,致力于支持Python解决计算机视觉问题。OpenCV在以下领域有着广泛的应用:
1、人机互动
2、物体识别
3、图像分割
4、人脸识别
5、动作识别
6、运动跟踪
7、机器
8、运动分析
9、机器视觉
10、结构分析
11、汽车安全驾驶
首先安装OpenCV模块,还是依赖于pip工具
在cmd命令中输入pip install opencv-python,安装完成之后,模块是以cv2的名字存在,可以通过importcv2来调用。
二、Numpy对图片的操作图片读入程序中后,是以numpy数组存在的。因此对numpy数组的一切功能,对图片也适用。对数组元素的访问,实际上就是对图片像素点的访问。
彩色图片访问方式为:img[i,j,c]。i表示图片的行数,j表示图片的列数,c表示图片的通道数(RGB三通道分别对应0,1,2)。坐标是从左上角开始。我们将使用此模块将Python列表转换为numpy数组,因为OpenCV人脸识别器接受numpy数组。
示例:
from PIL import Imagecat = Image.open(r'C:\Users\56331\Desktop\cat.jpg')cat>>>
cat_data = np.array(cat) cat_data.shape>>>(720, 1280, 3) # 该图片720行,1280列,3代表RGB(红、绿、蓝)三通道分别对应0,1,2
cat2 = cat_data[:,::-1,:] # 将列的方向翻转,改变图片方向Image.fromarray(ca