OCR
文章平均质量分 71
文字识别
uncle_ll
这个作者很懒,什么都没留下…
展开
-
OCR学术前沿及产业应用高峰论坛202204
ocr前沿讲座原创 2023-07-18 20:05:49 · 589 阅读 · 0 评论 -
基于paddelOCR的车票识别以及在PCB板上应用
PaddleOCR在车牌以及PCB板上的识别应用原创 2023-07-09 12:52:52 · 277 阅读 · 0 评论 -
自监督OCR识别-金教授讲座分享
金教授 自监督ocr分享原创 2023-02-23 20:59:24 · 237 阅读 · 0 评论 -
中文ocr-Benchmarking Chinese Text Recognition: Datasets, Baselines, andan Empirical Study
Benchmarking Chinese Text Recognition: Datasets, Baselines, andan Empirical Study论文链接:Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study项目链接:GitHub - FudanVI/benchmarking-chinese-text-recognition: This repository cont原创 2022-03-10 00:00:00 · 3048 阅读 · 0 评论 -
手写中文数据集
手写OCR数据集这里整理了常用手写数据集,持续更新中,欢迎各位小伙伴贡献数据集~中科院自动化研究所-手写中文数据集华南理工大学-手写中文数据集NIST手写单字数据集-英文中科院自动化研究所-手写中文数据集数据来源:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html数据简介:包含在线和离线两类手写数据,HWDB1.0~1.2总共有3895135个手写单字样本,分属7356类(7185个汉字和171个英文原创 2022-03-03 15:14:55 · 12073 阅读 · 17 评论 -
Windows使用PPOCRLabel
问题想使用PaddleOcr下面的标注工具PPOCRLabel进行图像文本检测标注,在windos下安装出现了一些问题,耗费了半天时间解决了这个问题项目地址:https://github.com/PaddlePaddle/PaddleOCR安装包requirements:shapelyscikit-imageimgaug==0.4.0pyclipperlmdbtqdmnumpyvisualdlpython-Levenshteinopencv-contrib-python==4.4.原创 2021-12-24 10:03:23 · 3312 阅读 · 0 评论 -
ocr 图像倾斜矫正-霍夫变换
图像预处理在ocr处理时候,可能遇到的图片会是倾斜的,导致检测不全问题,进而影响后续识别问题。常见的倾斜矫正方法霍夫轮廓检测randon 变换基于PCA的方法霍夫变换基本原理可以识别图像中的几何形状。它将图像空间中的特征点映射到参数空间进行投票,通过检测累计结果的局部极值点得到一个符合某特定形状的点的集合。经典霍夫变换用来检测图像中的直线,后来霍夫变换扩展到任意形状物体的识别,多为圆和椭圆。它的抗噪声、抗形变能力较强。另一种直线提取的方法是对图像边缘点进行链码追踪,在得到的链码串中提取原创 2021-05-07 18:59:11 · 7420 阅读 · 1 评论 -
ocr 图像倾斜矫正-radon变换
图像预处理在ocr处理时候,可能遇到的图片会是倾斜的,导致检测不全问题,进而影响后续识别问题。常见的倾斜矫正方法霍夫曼轮廓检测randon 变换基于PCA的方法radon变换本节说下randon变换基本原理Radon(拉东)算法是一种通过定方向投影叠加,找到最大投影值时角度,从而确定图像倾斜角度的算法。具体过程如图所示拉东变换若函数F表示一个未知的密度,对F做radon变换,相当于得到F投影后的讯号,举例来说:F相当于人体组织,断层扫描的输出讯号相当于经过radon变换的F。原创 2021-04-14 17:43:07 · 3245 阅读 · 1 评论 -
使用挤压、哈哈镜、扭曲进行文字图像增强
背景在做ocr项目时候,会涉及到两个部分,文字区域检测与文字图像识别。在之前的文章中有介绍目标检测图像数据增强(Data Augmentation)——对比度|加噪|随机调整颜色, 以及旋转数据增强等;这里将介绍下文字图像识别数据增强。方式文字图像数据增强来源有两种:基于文本内容去生成对应的图片基于已标记的文本图片去进行数据增强关于基本文本内容去生成对应的图片,网络上有很多生成工具箱: 比如Text Recognition Data Generator, 等,相关文章可以见OCR文本图像合原创 2020-12-09 13:40:35 · 1733 阅读 · 0 评论 -
OCR文本图像合成工具
OCR文本图像合成工具问题在进行文字识别时候,需要使用的数据集样式为一张含有文本的图片以及对应文本内容的标签。但是一般而言,实际情况是构建的文本字典中,每个字至少要出现200次才能有好的识别效果,因此,先对所有的label进行单字统计,看每个字出现的个数是否超过200次,如果不满足,则需要进一步收集数据。数据来源有两种:真实数据:通过真实数据去截取图片或者人工标注生成数据:通过文本去生成对应的文本图片真实数据的收集是比较费事费力的,因此可以使用一些生成数据的工具来无限量的生成想要的数据。原创 2020-10-27 17:14:35 · 1367 阅读 · 4 评论 -
OCR相关介绍
OCR相关介绍0 计算机视觉技术(computer version)计算机视觉是人工智能的一个重要分支,它要解决的问题就是:看懂图像里的内容。人的大脑皮层, 有差不多70% 都是在处理视觉信息。 是人类获取信息最主要的渠道,没有之一。下图是网络上新增数据的占比趋势图。灰色是结构化数据,蓝色是非结构化数据(大部分都是图像和视频)。可以很明显的发现,图片和视频正在以指数级的速度在增长。而在计算机视觉出现之前,图像对于计算机来说是黑盒的状态。一张图片对于机器只是一个文件。机器并不知道图片里的内容到底原创 2020-10-24 13:15:26 · 6538 阅读 · 0 评论 -
OCR算法识别性能评估
评估OCR算法识别率的指标通常有这几种:one全对准确率: 每张图片版面上有多个文本时候,每个文本都对的张数占总的张数的比例;标签全对准确率:每张图片版面上有多个文本时候,文本对的个数占总的文本个数的比例;平均编辑距离:平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标,可以同时反应识别错,漏识别和多识别的情况;字符识别准确率,即识别对的字符数占总识别出来字符数的比例,可以反应识别错和多识别的情况,但无法反应漏识别的情况;字符识别召回率,即识别对的字符数占实际字符数的比例原创 2020-10-22 10:11:20 · 4558 阅读 · 1 评论