图像处理
liuzard
刚毅木讷,近仁。
展开
-
OCR数据集生成利器—TextRecognitionDataGenerator
本文主要介绍通过开源项目TextRecognitionDataGenerator生成定制OCR数据集,用于训练模型和测试模型效果,达到特定场景下识别的优化。1、现有数据集的问题在自然场景(如照片,视频)的文字OCR识别中,由于文字的字体和颜色不同,长短和布局不定,同时文字所处背景的复杂性,模型训练后在特定场景下的文字识别效果依赖于数据集是否覆盖类似风格的文字(训练-测试同分布假设)。当前虽然有不少开放的大规模OCR数据集,比如牛津大学的Synthetic Word Dataset和Sy...原创 2020-10-31 17:16:04 · 11350 阅读 · 12 评论 -
一篇入门深度学习OCR:数据集和算法合集
当前OCR领域基本上已经是深度学习的天下了,近5年,在算法和数据集的双重加持下,OCR已经成为一个解决的问题,要做一个适合于自己的OCR系统,关键在于选择适合于自己场景的数据集和算法。本文主要记录OCR领域常用的数据集和算法,以及相关的开源项目和博客。1、OCR数据集和数据集生成工具在任何领域,深度学习成为主流意味着数据集是其中的关键,即使是相同的OCR模型,大规模数据集的训练能带来识别效果上质的提升。深度学习OCR处理主要分成两步走:(1)图片中的文本检测,即通过文本框框出图片中的文本原创 2020-10-31 16:34:53 · 12740 阅读 · 5 评论