16-Application Example Photo OCR

最新推荐文章于 2020-07-27 16:36:16 发布

DawnRanger

最新推荐文章于 2020-07-27 16:36:16 发布

阅读量753

点赞数

分类专栏： machine-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DawnRanger/article/details/48169317

版权

machine-learning 专栏收录该内容

22 篇文章 1 订阅

订阅专栏

1 - Problem Description and Pipeline 问题描述与系统流水线

problem description

2 - Sliding Windows 滑动窗口检测

在 Text detection 和 Character segmentation 中需要用到滑动窗口。

Text detection 步骤：

首先用已有数据训练模型（如Neural network等），用于识别出图片内容是否为文本。

training
- 用不同大小的窗口分别对整幅图片进行滑动窗口扫描，识别出所有的文本区域
sliding window detetion

Character segmentation 步骤：

用已有数据训练模型，用于识别字母之间的分隔线：
用滑动窗口扫描已经识别出来的文本区域，找到其中的分割线。

3 - Getting Lots of Data and Artificial Data 如何获取大量的数据、人工制造数据

示例：如何构造字母识别的数据
character recognition
人工合成数据：利用已有字库，加上不同的背景即可构造大量数据。
artificial data synthesis

引入扭曲/失真(distortion)来合成数据：

声音的人工合成：加入不同的背景声音。

关于人工合成数据的注意事项：

Distortion introduced should be representation of the type of noise/distortions in the test set.（加入的混淆应该是真实存在有意义的）
Usually does not help to add purely random/meaningless noise to your data.（如对图像的每一个点加入混淆）

关于获取大量数据的思考：

在尝试人工制造大量数据之前应该保证模型是 low bias 的（绘制 learning curve）
获取 10 倍于当前数据的成本如何？可选方法：
- Artificial data synthesis 人工数据合成
- Collect/label it yourself 自己收集
- “Crowd source” (E.g. Amazon Mechanical Turk) 众包方式

4 - Ceiling Analysis What Part of the Pipeline to Work on Next 关于系统优化的天花板分析

ceil analysis
表中列举了改进系统各个部分至最优的情况下，能对系统的政体效率提高的程度，可见改进 Text detection 能对系统的改进有较大帮助改善，而改善 character segmentation 却没有太大必要，改进 Character recognition 也能起到较大提升作用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

DawnRanger CSDN认证博客专家 CSDN认证企业博客

码龄10年

89: 原创

12万+: 周排名

167万+: 总排名

37万+: 访问

: 等级

3763: 积分

98: 粉丝

144: 获赞

48: 评论

279: 收藏

私信

关注

热门文章

分类专栏

最新评论

python实现静态变量
iamthebest100: class Foo(object): count = 0 f1 = Foo() f2 = Foo() f1.count = 1 print(f1.count, f2.count) # 结果: 1 0 这代码在其他语言中挺正常的啊~~~~
Python 星号表达式(starred expression)
lyitcc: 这种星号表达式被赋值对象只能支持，列表和元组类型，加个逗号是声明此对象是个元组类型，加个中括号也可以
Python 星号表达式(starred expression)
须弥互联网首席指挥官: [code=python] a,*b=range(5) a Out[168]: 0 b Out[169]: [1, 2, 3, 4] a,b,*c,d=range(6) c Out[171]: [2, 3, 4] a,*b,*c=range(5) File "<ipython-input-172-5d7c8a815e8a>", line 1 a,*b,*c=range(5) ^ SyntaxError: two starred expressions in assignment a,b,*c=range(5),range(5) a Out[174]: range(0, 5) b Out[175]: range(0, 5) c Out[176]: [] range(5),*range(5) Out[177]: (range(0, 5), 0, 1, 2, 3, 4) *range(5),*range(5) Out[178]: (0, 1, 2, 3, 4, 0, 1, 2, 3, 4) a,b,*c=range(5),*range(5) a Out[184]: range(0, 5) b Out[185]: 0 c Out[186]: [1, 2, 3, 4] [/code] 多看一些例子就懂了
过滤非utf-8字符
锦鱼不忘旧时晨: 给个非utf-8的字符测试一下啥，你测试了吗？大哥
python实现静态变量
szh_19840508: 其实应该在get_count和set_count两个方法前加上@staticmethod

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。