python可以做哪些图像处理_用Python做图像处理

最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.6 ,用起来非常方便。大家可以在 http://www.pythonware.com/products/pil/index.htm 下载和学习。

在这里,我主要是介绍一下做图像识别时可能会用到的一些 PIL 提供的功能,比如图像增强、还有滤波之类的。最后给出使用 Python 做图像处理与识别的优势与劣势。

基本图像处理

使用 PIL 之前需要 import Image 模块:

import Image

然后你就可以使用Image.open(‘xx.bmp’) 来打开一个位图文件进行处理了。打开文件你不用担心格式,也不用了解格式,无论什么格式,都只要把文件名丢给 Image.open 就可以了。真所谓 bmp、jpg、png、gif……,一个都不能少。

img = Image.open(‘origin.png’) # 得到一个图像的实例对象 img

105b915713a74058a8b805dd5dffcceb.png

图 1原图

图像处理中,最基本的就是色彩空间的转换。一般而言,我们的图像都是 RGB 色彩空间的,但在图像识别当中,我们可能需要转换图像到灰度图、二值图等不同的色彩空间。 PIL 在这方面也提供了极完备的支持,我们可以:

new_img = img.convert(‘L’)

把 img 转换为 256 级灰度图像, convert() 是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:

· 1 (1-bit pixels, black and white, stored with one pixel per byte)

· L (8-bit pixels, black and white)

· P (8-bit pixels, mapped to any other mode using a colour palette)

· RGB (3x8-bit pixels, true colour)

· RGBA (4x8-bit pixels, true colour with transparency mask)

· CMYK (4x8-bit pixels, colour separation)

· YCbCr (3x8-bit pixels, colour video format)

· I (32-bit signed integer pixels)

· F (32-bit floating point pixels)

怎么样,够丰富吧?其实如此之处,PIL 还有限制地支持以下几种比较少见的色彩模式:LA (L with alpha), RGBX (true colour with padding) and RGBa (true colour with premultiplied alpha)。

下面看一下 mode 为 ‘1’、’L’、’P’时转换出来的图像:

f14443bd90b74f4f9d714156dd35f6d8.gif

图 2 mode = '1'

8511e85898a44bf4bd8902fe830a18f8.gif

图 3 mode = 'L'

586b0aefd5b84cee880676449805f843.gif

图 4 mode = 'P'

convert() 函数也接受另一个隐含参数 matrix,转换矩阵 matrix 是一个长度为4 或者16 tuple。下例是一个转换 RGB 空间到 CIE XYZ 空间的例子:

rgb2xyz = (

0.412453, 0.357580, 0.180423, 0,

0.212671, 0.715160, 0.072169, 0,

0.019334, 0.119193, 0.950227, 0 )

out = im.convert("RGB", rgb2xyz)

除了完备的色彩空间转换能力外, PIL 还提供了resize()、rotate()等函数以获得改变大小,旋转图片等几何变换能力,在图像识别方面,图像实例提供了一个 histogram() 方法来计算直方图,非常方便实用。

图像增强

图像增强通常用以图像识别之前的预处理,适当的图像增强能够使得识别过程达到事半功倍的效果。 PIL 在这方面提供了一个名为 ImageEnhance 的模块,提供了几种常见的图像增强方案:

import ImageEnhance

enhancer = ImageEnhance.Sharpness(image)

for i in range(8):

factor = i / 4.0

enhancer.enhance(factor).show("Sharpness %f" % factor)

上面的代码即是一个典型的使用 ImageEnhance 模块的例子。 Sharpness 是 ImageEnhance 模块的一个类,用以锐化图片。这一模块主要包含如下几个类:Color、Brightness、Contrast和Sharpness。它们都有一个共同的接口 .enhance(factor) ,接受一个浮点参数 factor,标示增强的比例。下面看看这四个类在不同的 factor 下的效果

5825d40ae0f549df99e342aa0c429534.gif

d96015d0754d41f08647dc815894f5ef.png

7e93135f6fe04b87b7ada0ef04913629.png

77520434439d47e581215a982db95af4.png

6cc251a0067a4af5a0a46a9b175a688a.png

4f2df2149b454d7fa8c8bcc15170df4e.png

d36a9bd9869542f5bbb3a6f3519c8d1e.png

05e8e4288895469e9284860465e4ba37.png

b0599566b758443b983eb37a0ac4b746.png

图 5 使用Color 进行色彩增强,factor 取值 [0, 4],步进 0.5

e1038e8403c74c08ac940babf2e64d5e.gif

0c4ae712efb44fc7a57328c1e6fed53c.png

b5d1a48f62a24d4a8607229c4c8abdf5.png

4cd2ae28e2e049aa8db613d297087f77.png

7d6bb44bcbe8423c93fafcbc8e022337.png

7dc67787176d4e299c6f55db64c97e99.png

b32d9a55c1214c779640008df29d8064.png

36359d1eb3524bd7847b2cded7c55f00.png

376a2121991b425aa61ad3c17d8e1188.png

图 6 用 Birghtness 增强亮度,factor取值[0,4],步进0.5

2f3db13678e64ba38c0c965697731749.gif

6f7456f4bd1f44a3a784f9c4a73cc857.png

8f1018ae79dd469586c46c582f0f4870.png

59a251551fa34309874077c816a607c5.png

a6263e65f2964f2980be436a713c8b98.png

1f10bf7cdea646cb965e808ddd1a32ef.png

10a23b13304c4afebb20f51f0ababfd8.png

e4ef2a90fe204789a6b850e5d98c90e1.png

b8648bc7943448228c2d3a371bd74ea0.png

图 7用 Contrast 增强对比度, factor 取值 [0,4],步进0.5

72bc4b5b9a944ceda41824738da20769.png

6e10be3591514893b3eff5a2ac0b7a7d.png

01bad57e33144a4b82177ad1f1e501a5.png

b0e362ef4f704927a28958856dd60fea.png

6a204aac6bf340c2ad4c95ab48074b62.png

f4c61612c912488ba3be374dd2cfd4cd.png

91c4a4cf198a4ca882030481e2ccc2b7.png

c6a522c59fca412c83a9f675467734f8.png

7409f2ee93c046fdb2970750c59b9171.png

图 8用 Sharpness 锐化图像,factor取值 [0,4],步进0.5

图像 Filter

PIL 在 Filter 方面的支持是非常完备的,除常见的模糊、浮雕、轮廓、边缘增强和平滑,还有中值滤波、ModeFilter等,简直方便到可以做自己做一个Photoshop。这些 Filter 都放置在 ImageFilter 模块中,ImageFilter主要包括两部分内容,一是内置的 Filter,如 BLUR、DETAIL等,另一部分是 Filter 函数,可以指定不同的参数获得不同的效果。示例如下:

import ImageFilter

im1 = im.filter(ImageFilter.BLUR)

im2 = im.filter(ImageFilter.MinFilter(3))

im3 = im.filter(ImageFilter.MinFilter()) # same as MinFilter(3)

可以看到 ImageFilter 模块的使用非常简单,每一个 Filter 都只需要一行代码就可调用,开发效率非常高。

a5e65f4337a24e04a7fd275d18c2e258.png

图 9使用 BLUR

8ec143c4358d45a390adbbc9c7698bd9.png

图 10使用 CONTOUR

15d50813d32242a3b597741c2e1e5271.png

图 11使用 DETAIL

d8141bcc3ab34206939aec6014a50b28.png

图 12使用 EMBOSS

ce9e7a19139e4fe084b0aef0de156f34.png

图 13使用 EDGE_ENHANCE

17560f5dfb644e8d9f93e050b1757b99.png

图 14使用 EDGE_ENHANCE_MORE

aa6b94ee9b964c89a7ad0f3b2204ccd7.png

图 15使用 FIND_EDGES

8ae9c4fb3630455f9101756ce4432e66.png

图 16使用 SHARPEN

abaae387f57c4edebbbb0b52caf3de56.png

图 17使用 SMOOTH

570b17ae469645199568736b5b50e7cf.png

图 18使用 SMOOTH_MORE

以上是几种内置的 Filter 的效果图,除此之外, ImageFilter 还提供了一些 Filter 函数,下面我们来看看这些可以通过参数改变行为的 Filter 的效果:

f18ed465b925443e84156bd27adf05d1.png

图 19使用 Kernel(),参数:size = (3, 3), kernel = (0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5)

e20d44d8fa6a4ad5b0ce84688b683c05.png

图 20使用 MaxFilter,默认参数

a8bf4eb9e140460c8f9ea6b52849c017.png

图 21使用 MinFilter,默认参数

cce283a6f92f4b0b818a2497f242cbf6.png

图 22使用 MedianFilter,默认参数

ef010a1a01a44ddf802c3bf1b3ac0beb.png

图 23使用 ModeFilter,参数 size = 3

cdf0142eb6064994a0af672de451fb2b.png

图 24使用 RankFilter,参数 size = 3, rank = 3

小结

到此,对 PIL 的介绍就告一段落了。总的来说,对于图像处理和识别,PIL 内建了强大的支持,从各种增强算法到 Filter ,都让人无法怀疑使用 Python 的可行性。 Python唯一的劣势在于执行时间过慢,特别是当实现一些计算量大的算法时候,需要极强的耐心。我曾用 Hough Transform(霍夫变换)来查找图像中的直线,纯 Python 的实现处理一个 340 * 100 的图片也要花去数秒时间(P4 3.0G + 1G memory)。但使用 PIL 无需关注图像格式、内建的图像增强算法和 Filter 算法,这些优点使 Python 适合用于构造原型和进行实验,在这两方面Python 比 matlab 更加方便。商业的图像识别产品开发,可以考虑已经被 boost accepted的来自 adobe 的开源 C++ 库 gil,可以兼顾执行性能和开发效率。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值