基于OpenCV和傅里叶变换的文本图片校正

之前没有接触过基于傅立叶变换的图像校正方法,偶然发现博主JohnHany的OpenCV实现基于傅立叶变换的旋转文本校正这篇文章比较详细,在一番研读和实际操作后体会颇多,现总结如下。

1.  傅立叶变换与图像处理

在信号处理中,傅立叶变换用于将时域信号转换到频域上。图像也可以看作一种平面空间上的二维信号,所以对图像也可以施加傅立叶变换,对图像施加傅立叶变换的结果,就是将其从空间域变换到频域中。

从实际意义上说,对图像进行二维傅立叶变换得到频谱图,就是图像梯度的分布图,如果频谱图中暗的点数更多,那么实际图像是比较柔和的;反之,如果频谱图中亮的点数多,那么实际图像一定是尖锐的,也就是边界分明且两边像素差异较大的。

2.  思路

利用这个特性,就可以产生一些很具实际意义的应用了,比如常见的横排版的文本图像,由于有文字的行整体上是较暗的,行间的空白是较亮的,这就自然形成了明暗交替的特征。通过上述傅立叶变换,即可在频谱图上产生垂直于行的亮线,再通过hough方法检测这条直线,并算得其与水平线的夹角,接着对原图施加合适角度的旋转变换即可校正原图了。当然,为了弥补由于旋转造成的图像部分空缺,还要对图像进行延扩处理。

3.  主要涉及OpenCV函数

(1)  void merge(const Mat* mv,size_t count, OutputArray dst)

用于矩阵融合,在本应用中,将要处理的图像作为傅立叶变换输入的实部,一个全零的矩阵作为虚部,函数merge()用来  融合这两个矩阵。

(2)  getOptimalDFTSize(intvecsize)

OpenCV中使用的快速傅立叶算法要求图像尺寸是2、3、5的倍数时候处理速度最快,这个函数可以根据实际待处理图像的尺寸找到合适的傅立叶变换输入尺寸,得到尺寸后用copyMakeBorder()填充多余部分。事实上,纯色填充导致后面的傅立叶谱图出现水平、垂直亮线,然而这并不影响我们判断文字行的方向。

(3)  dft(InputArray src,OutputArray dst, int flags=0, int nonzeroRows=0)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值