为了提高Tesseract识别的准确性,需要对图片进行一些处理。
灰度化
RGB颜色模型
一种加色模型,将红(Red)、绿(Green)、蓝(Blue)三原色的色光以不同的比例相加,以产生多种多样的色光,且三原色的红绿蓝不可能用其他单色光合成。
RGB色彩模式使用RGB模型为图像中每个像素的RGB分量分配一个0~255范围内的强度值。RGB图像仅仅使用三种颜色,R(red)、G(green)、B(blue),就能够使它们依照不同的比例混合,在屏幕上呈现16777216(256 * 256 * 256)种颜色。
什么是灰度化
在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0-255。0%的灰度RGB数值是255,255,255;1%灰度的RGB数值是253,253,253;2%灰度RGB值为250,250,250。
灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑白两种颜色,灰度图像在黑色与白色之间还有许多级的颜色深度。
灰度化的方法
约定:
f(i,j) 为二维图片中坐标为 (i,j) 的点的灰度值,R(i,j)、G(i,j)、B(i,j)分别为坐标为 (i,j) 的点在red、green、bule分量上的值。
1. 分量法
将彩色图像中的三分量的亮度作为三个灰度图像的灰度值,可根据应用需要选取一种灰度图像。
f1(i,j)=R(i,j)
f2(i,j)=G(i,j)
f3(i,j)=B(i,j)
2. 最大值法
将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。
f(i,j) = max(R(i,j),G(i,j),B(i,j))
3. 平均值法
将彩色图像中的三分量亮度求平均得到一个灰度图。
f(i,j) = (R(i,