目 次
第
1
章
绪论
............................................................................................................... 1
1.1
研究背景
........................................................................................................ 1
1.2
研究意义
........................................................................................................ 2
1.3
相关研究现状
................................................................................................ 3
1.4
研究内容与方法
............................................................................................ 5
1.4.1
研究内容
..................................................................................................... 5
1.4.2
研究方法
..................................................................................................... 6
1.4.3
技术路线图
................................................................................................. 7
1.5
主要创新点
.................................................................................................... 7
第
2
章
相关理论基础
............................................................................................... 9
2.1
二值图像最小连通区域噪点剔除法
............................................................ 9
2.2
二维黑白图像特征提取
.............................................................................. 10
2.2.1
黑白二值图像投影
................................................................................... 10
2.2.2
一维有限区域叠加和卷积
....................................................................... 11
2.3
有限状态机理论基础
.................................................................................. 13
2.3.1
有限状态机的概念及工作原理
............................................................... 13
2.3.2
有限状态机表示方法
............................................................................... 13
2.4
本章小结
...................................................................................................... 14
第
3
章
研究方案设计
............................................................................................. 15
3.1
整体方案设计
.............................................................................................. 15
3.2
图像黑白二值化与噪点剔除
...................................................................... 16
3.3
图像版式识别
.............................................................................................. 16
3.3.1
图像垂直投影区分文字列块
................................................................... 16
3.3.2
对列块水平投影切分行块
....................................................................... 17
- III -
华北理工大学硕士学位论文
3.3.3
查找文字块显性特征
............................................................................... 18
3.3.4
确定显性行状态信息
............................................................................... 20
3.3.5
文字块切分与图像重组
........................................................................... 20
3.4
有限状态机设计
.......................................................................................... 21
3.4.1
行状态
....................................................................................................... 21
3.4.2
状态跃迁条件
........................................................................................... 22
3.4.3
构建有限状态机
....................................................................................... 22
3.5
基于上下文的文字逻辑组装机制
.............................................................. 23
3.6
本章小结
...................................................................................................... 25
第
4
章
方案实施
..................................................................................................... 26
4.1
数据采集
...................................................................................................... 26
4.2
图像黑白二值化与噪点去除
...................................................................... 27
4.3
版式识别与图像重组
.................................................................................. 27
4.3.1
图像列块切分
........................................................................................... 27
4.3.2
文字行块切分
........................................................................................... 27
4.3.3
查找文字块显性特征及确定显性行状态
............................................... 28
4.3.4
文字块切分与图像重组
........................................................................... 29
4.4
基于百度云的
OCR
文字识别
.................................................................... 29
4.5
状态机构建与内容重组
.............................................................................. 30
4.6
本章小结
...................................................................................................... 30
第
5
章
方案验证与评价
......................................................................................... 32
5.1
方案验证
...................................................................................................... 32
5.2
方案评价
...................................................................................................... 35
5.3
方案推广
...................................................................................................... 36
5.4
本章小结
...................................................................................................... 42
结
论
......................................................................................................................... 43
参考文献
..................................................................................................................... 44