1 简介
图片中文字的检测和识别是图片检索和标注的关键技术,该技术主要由3个部分组成:文字区域检测,图片文字分割和OCR识别。本文研究了其中的图片文字分割技术,提出了一种解决该问题的方法:首先对图片进行预处理,用非线性对比度拉伸的方法提高图片中文字与背景的对比度;然后进行二值化处理,通过分析连通分量的几何特征以去除噪声。试验结果表明本文的方法能够取得比较好的图片文字分割效果。
2 完整代码
I=imread('brand02.jpg');
HS_I=double(I);
tic
G=gradient(HS_I); % 计算梯度值
[y,x]=size(I);
T=60;
%%%%%%% 商标文字分割 %%%%%%%%%%
n=30;
GY=zeros(y,1);
for j=1:y
for i=1:x-n
Max=max(G(j,i:i+n));
Min=min(G(j,i:i+n));
MGD(j,i)=Max-Min; % 计算最大梯度差
if (MGD(j,i)>T)
GY(j,1)=GY(j,1)+1; % MGD大于阈