OCR基础知识(第二章预处理)

OCR基础知识

2.1 二值化

2.1.1 全局阈值方法

  1. 固定阈值方法
  2. 2.otsu算法 (ret1, th1 = cv2.threshold(gray, 0, 255, cv2.THRESH_OTSU)
    2.1.2局部阈值方法
    1.自适应阈值算法
    主要思想:以一个像素点为中心设置大小为s✖️s的滑窗,每次扫描均对窗口内的像素求均值并作为局部阈值,高于t/100,赋值为0;低于t/100,赋值为255
    2.Niblack算法
    主要思想:窗口内的像素值计算阈值T(x, y) = m(x, y) + ks(x, y)
    T(x,y)阈值
    m(x,y)均值
    s(x,y)方差
    K修正系数
    与m(x,y)相近的像素点被判定为背景,反之为前景
    3.Sauvola算法
    对文档二值化
    T=m[1+k(s/R-1)]
    R是标注方差的动态范围,m可以减小染色、污渍带来的影响
    2.1.3深度学习的方法
    DIBCO、PLM是两个二值化的数据集
    FCN方法

2.2 平滑去噪

2.2.1空间滤波
1.线性滤波器
平滑线性滤波器 img = cv2.blur(img, (5,5))
高斯滤波器 img = cv2.GaussianBlur(img, (5,5),0)
2.非线性空间滤波器
中值滤波 对邻域内的值进行排序,中值作为输出 img = cv2.medianBlur(img, 5)
双边滤波 img = cv2.bilateralFilter(img, 9, 75, 75)
2.2.2小波阈值去噪
2.2.3非局部方法
1.NL-means
2.BM3D(最好用)
2.2.4基于神经网络
1.MLP
2.LLNet

2.3 倾斜角检测和矫正

2.3.1霍夫变换
2.3.2Radon变换
2.3.3基于PCA的方法

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值