一步一步来吧
上一节:
Python+Opencv图像处理新手入门教程(二):颜色空间转换,图像大小调整,灰度直方图
1.Intro
今天这节我们主要研究利用阈值处理图像。例如对于输入图像:
如何做一个简单的"扫描全能王",让里面的文字变得清晰?
2.threshold
2.1.函数原型
retval, dst = cv.threshold(src, thresh, maxval, type[, dst])
- src:原图像
- dst:输出图像
- thresh:当前阈值
- maxVal:最大阈值,一般为255
- thresholdType:阈值类型,如THRESH_BINARY
在THRESH_BINARY模式下,有:
d
s
t
(
x
,
y
)
=
{
m
a
x
v
a
l
i
f
s
r
c
(
x
,
y
)
>
t
h
r
e
s
h
0
o
t
h
e
r
w
i
s
e
dst(x,y) = \left\{ \begin{array}{l} {\mathop{\rm maxval}\nolimits} \quad if\;src(x,y) > thresh\\ 0\quad otherwise \end{array} \right.
dst(x,y)={maxvalifsrc(x,y)>thresh0otherwise
即,如果某个像素点的灰度值大于阈值,则将其设置为我们给定的maxVal(一般为255),也就是将该像素置为白色;否则,将其设置为0,也就是将该像素置为黑色。
2.2.图像分析
将原图像转化为灰度图像并绘制灰度直方图:
# -*- coding: utf-8 -*-
import cv2
import matplotlib.pyplot as plt
def plt_hist(img):
plt.hist(img.ravel(), 256, [0, 256])
plt.show()
img = cv2.imread(r'D:\bookpage.jpg')
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
plt_hist(gray_img)
得到灰度直方图如下:
可以看到灰度值高峰位于10左右。
2.3.二值化处理
基于对灰度直方图的观察,我们尝试以10为阈值对图像进行二值化处理:
# -*- coding: utf-8 -*-
import cv2
img = cv2.imread(r'D:\bookpage.jpg')
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
retval, res = cv2.threshold(gray_img, 10, 255, cv2.THRESH_BINARY)
cv2.imshow('owo', res)
cv2.waitKey(0)
cv2.destroyAllWindows()
处理后的图像长这样:
其灰度直方图如下:
可以看到,对于超出灰度阈值的像素,其灰度值被调整为255,反之调整为0。整个图像的灰度值只剩0与255这两个值,即所谓二值化。
2.4.自适应阈值
opencv提供了adaptiveThreshold方法来进行自适应阈值操作。也就是说,图像不同区域的阈值是不同的,这样便可能带来更好的去阴影效果。
函数原型:
dst = adaptiveThreshold(src, maxValue, adaptiveMethod, thresholdType, blockSize, C)
- src:原图像
- maxVal:最大阈值,一般为255
- dst:输出图像
- adaptiveMethod:自适应方法
- thresholdType:阈值类型,如THRESH_BINARY
- blockSize:像素领域大小,注意必须为奇数
- C:偏移值调整量(供相应的自适应方法使用)
自适应方法有两种,分别为
- ADAPTIVE_THRESH_MEAN_C
先求出块(blockSize)中的均值,再减去C - ADAPTIVE_THRESH_GAUSSIAN_C
先求出块中的加权和(权表示当前像素距中心像素的距离),再减掉C。块中像素距中心越远,"影响力"则越小,相应权值越低。
从上面的分析可得,当blockSize较小时,两种自适应方法的结果相差不大(此时权值的影响较小);而当blockSize较大时,MEAN方法会更强调"整体"的轮廓,而GAUSSIAN方法由于权值的设计会将整体轮廓进行削弱。实际使用过程中最好两种方法都试一试,进行效果对比。
# -*- coding: utf-8 -*-
import cv2
img = cv2.imread(r'D:\bookpage.jpg')
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
res = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 115, 1)
cv2.imshow('owo', res)
cv2.waitKey(0)
cv2.destroyAllWindows()
高斯法处理后的图像长这样:
res = cv2.adaptiveThreshold(gray_img, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 115, 1)
均值法处理后的图像长这样:
对于这张图片的处理,均值法的性能是优于高斯法的。