用于图像处理的Python顶级库

 
 

点击上方“小白学视觉”,选择加"星标"或“置顶

 
 
重磅干货,第一时间送达

介绍

正如IDC所指出的,数字信息将飙升至175 ZB,而这些信息中的巨大一部分是图片。数据科学家需要(预先)测量这些图像,然后再将它们放入人工智能和深度学习模型中。在愉快的部分开始之前,他们需要做重要的工作。

为了快速地处理大量信息,科学家需要利用图像准备工具来完成人工智能和深度学习任务。

在本文中,我将深入研究Python中最有用的图像处理库,这些库正在人工智能和深度学习任务中得到大力利用。我们开始吧!

c43698acf5bd716fbb69c5287dd34d92.jpeg

目录

  1. OpenCV

  2. Scikit-Image

  3. Scipy

  4. Python Image Library (Pillow/PIL)

  5. Matplotlib

  6. SimpleITK

  7. Numpy

  8. Mahotas

OpenCV

OpenCV是最著名和应用最广泛的开源库之一,用于图像处理、目标检测、人脸检测、图像分割、人脸识别等计算机视觉任务。除此之外,它还可以用于机器学习任务。

这是英特尔在2002年开发的。它是用C++编写的,但是开发人员已经提供了Python和java绑定。它易于阅读和使用。

为了建立计算机视觉和机器学习模型,OpenCV有超过2500种算法。这些算法对于执行各种任务非常有用,例如人脸识别、目标检测等。让我们看一些可以使用OpenCV执行的示例:

9229d2e1c09f64c3d7c7796b0dbb9a78.png

灰度缩放

灰度缩放是一种将3通道图像(如RGB、HSV等)转换为单通道图像(即灰度)的方法。最终的图像在全白和全黑之间变化。灰度缩放的重要性包括降维(将3通道图像转换为单通道图像)、降低模型复杂度等。

下面的代码片段显示了OpenCV中的灰度缩放
import cv2 as cv
img = cv.imread('example.jpg')
cv.imshow('Original', img)
cv.waitKey()
#Use cvtColor, to convert to grayscale
gray_img = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
cv.imshow('Grayscale', gray_img)
cv.waitKey(0)

9e051257562fd1ed75b4af5a37ee8941.png

旋转图像

OpenCV有助于使用从0到360度的任意角度旋转图像。

检查以下代码以将图像旋转180度。
import cv2 as cv
import matplotlib.pyplot as plt
img = cv.imread('example.jpg')
h, w = image.shape[:2]
rot_matrix = cv.getRotationMatrix2D((w/2,h/2), -180, 0.5)
rot_image = cv.warpAffine(img, rot_matrix, (w, h))
plt.imshow(cv.cvtColor(rot_image, cv.COLOR_BGR2RGB))

b104c32c683e234775b4749b6a768224.png

OpenCV还提供了除我们到目前为止讨论的功能之外的其他功能。除此之外,它还有助于人脸检测、图像分割、特征提取、目标检测、三维重建等。

有关更多信息,请查看官方文档:https://opencv.org/

Scikit-Image

Scikit Image是另一个伟大的开源图像处理库。它几乎适用于任何计算机视觉任务。它是最简单、最直接的库之一。这个库的某些部分是用Cython编写的(它是python编程语言的超集,旨在使python比C语言更快)。

它提供了大量的算法,包括分割、颜色空间操作、几何变换、滤波、形态学、特征检测等。

Scikit Image使用Numpy数组作为图像对象。让我们看看如何在scikit图像中执行活动轮廓操作。活动轮廓描述图像中形状的边界。

c9b713ec0fa8ee95152c19517cec32f0.png

检查以下活动轮廓操作代码:
import numpy as np
import matplotlib.pyplot as plt
from skimage.color import rgb2gray
from skimage import data
from skimage.filters import gaussian
from skimage.segmentation import active_contour
image = data.astronaut()
# Data for circular boundary
s = np.linspace(0, 2*np.pi, 400)
x = 220 + 100*np.cos(s)
y = 100 + 100*np.sin(s)
init = np.array([x, y]).T
# formation of the active contour
centre = active_contour(gaussian(image, 3),init, alpha=0.015, beta=10, gamma=0.001)
figure, axis = plt.subplots(1, 2, figsize=(7, 7))
ax[0].imshow(image, cmap=plt.cm.gray)
ax[0].set_title("Original Image")
ax[1].imshow(image, cmap=plt.cm.gray)

f91d37eb781020f6f509efed60f36d50.png

有关更多信息,请查看官方文档:https://scikit-image.org/docs/stable/auto_examples/

Scipy

SciPy主要用于数学和科学计算,但有时也可以使用子模块SciPy.ndimage用于基本的图像操作和处理任务。

归根结底,图像只是多维数组,SciPy提供了一组用于操作n维Numpy操作的函数。SciPy提供了一些基本的图像处理操作,如人脸检测、卷积、图像分割、读取图像、特征提取等。

除此之外,还可以执行过滤,在图像上绘制轮廓线。

764e732836a63005b6dd20da24895ef5.png

请检查以下代码以使用SciPy模糊图像:

from scipy import ndimage, misc
from matplotlib import pyplot as plt
f = misc.face()
b_face = ndimage.gaussian_filter(f, sigma=3)
figure, axis = plt.subplots(1, 2, figsize=(16, 8))

d42e597113b8ef5fc972a1be3a0499ae.png

有关更多信息,请查看官方文档:https://docs.scipy.org/doc/scipy/reference/ndimage.html

Python Image Library (Pillow/PIL)

它是一个用于图像处理任务的开放源码python库。它提供了其他库通常不提供的特殊功能,如过滤、打开、操作和保存图像。这个库支持多种文件格式,这使它更高效。PIL还支持图像处理、图像显示和图像存档等功能。让我们看看使用Pillow/PIL的图像增强。

8424934f93e96fd157359f831b0c349c.png

更改图像的清晰度:

5b071cadbca1b62d4e47a52255bdff94.png

有关更多信息,请查看官方文档:https://pillow.readthedocs.io/en/stable/index.html

Matplotlib

Matplotlib主要用于二维可视化,如散点图、条形图、直方图等,但我们也可以将其用于图像处理。从图像中提取信息是有效的。它不支持所有的文件格式。

3b26a90e4ee83e4145843a85e706cd2a.png

背景颜色更改操作后,请检查以下图像:

8b14b81f04206eef68e8e8092dd736ed.png

有关更多信息,请查看官方文档:https://matplotlib.org/stable/tutorials/introductory/images.html

SimpleITK

它也称为图像分割和注册工具包。它是一个用于图像注册和图像分割的开源库。像OpenCV这样的库将图像视为一个数组,但是这个库将图像视为空间中某个区域上的一组点。检查以下示例:

8b6a2f3efea07dd3ac08443c30b75729.png

图像分割

有关更多信息,请查看官方文档:https://itk.org/

Numpy

它是一个用于数值分析的开放源码python库。它包含一个矩阵和多维数组作为数据结构。但是NumPy也可以用于图像处理任务,例如图像裁剪、操作像素和像素值的蒙版。

61f48d0ad4f3248acbc114c653ee87ad.png

检查下图以从图像中提取绿色/红色/蓝色通道:

dcf1d432eebda6dd0c82aa3cc8eb5bc8.png

有关更多信息,请查看官方文档:https://scikit-image.org/docs/dev/user_guide/numpy_images.html

Mahotas

它是另一个用于计算机视觉和图像处理的开放源码python库。它是为生物信息学而设计的。它提供了很多算法,这些算法是用C++编写的,速度很快,使用了一个好的Python接口。它以NumPy数组读取和写入图像。

使用Mahotas检查下面的模板匹配图像:

c2722f665541ee9db2c0e240ae2de250.png

有关更多信息,请查看官方文档:https://mahotas.readthedocs.io/en/latest/#

结论

因此,在本文中,我们介绍了2021年机器学习用python中排名前8位的图像处理库。我希望你从这个博客中学到一些东西,对你的项目有益。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值