OCR
张欣-男
人,最宝贵的是生命;它,给予我们只有一次。人的一生,应当这样度过:当他回首往事时,不因虚度年华而悔恨,也不因碌碌无为而羞耻;这样在他临死的时候,他就能够说:我已经把我的整个生命和全部精力,都献给了这个世界上最壮丽的事业——为了人类的解放而斗争
展开
-
优化PaddleOCR结果可视化方法
上次重写了OCR结果可视化后,对于倾斜的文本框,可视化时文本会画在框外,看着非常不 舒服,这次我先把文字画好,然后再贴到图中,虽然麻烦点,看是看着舒服多了。原创 2022-09-02 07:15:04 · 1359 阅读 · 2 评论 -
基于文本检测——主体提取和透视变换效果_图像限制2000
基于文本检测,在实现大角度 倾斜旋转后,我又根据文本框区域进行了主体提取和透视变换。示例1第一次旋转:第二次旋转:主体提取:透视变换:示例2第一次旋转:第二次旋转:主体提取:透视变换:...原创 2020-10-28 22:22:34 · 178 阅读 · 0 评论 -
基于文本检测——主体提取和透视变换效果
基于文本检测,在实现大角度 倾斜旋转后,我又根据文本框区域进行了主体提取和透视变换。示例1第一次旋转:第二次旋转:主体提取:透视变换:示例2第一次旋转:第二次旋转:主体提取:透视变换:...原创 2020-10-28 22:01:48 · 179 阅读 · 0 评论 -
PaddleOCR方向分类器优化输入图像
方向分类器对于过长或者过短的分类效果可能不好。例如过长的情况:虽然能分对,但是置信度分别是[‘0’, 0.8890628]和[‘180’, 0.97985005]。过短的文本如一个字符:分类的情况分别是[‘0’, 0.84042734]和[‘180’, 0.9551178]。我们在测试大量图片时,有些过长的文本出现了明显的错误,因此我对图像进行了处理:如果是过长的文本则进行截断,过短的文本则复制扩展成输入图像的尺寸。修改后过长文本测试效果:[‘0’, 1.0]和[‘180’, 1.0]原创 2020-09-29 15:43:37 · 2457 阅读 · 2 评论 -
DB文本检测算法论文笔记
0 概述 基于分割的文本检测算法,后处理是必须的,将概率图转成文本框(区域)。DB算法在分割网络中执行一个二值化处理。随着DB模块的优化,分割网络可以自动设置二值化阈值,不仅简化了后处理而且增强了性能。补充:F-measure 即:F1=2∗PRP+RF_1=\frac {2 * PR}{ P + R}F1=P+R2∗PRP 是精确率(Precision),R是召回率(Recall)。1 介绍当前大部分检测算法都是使用如下流程:(1)设置一个固定的阈值,将概率图转成二值图。(2)然原创 2020-08-21 01:09:58 · 2766 阅读 · 0 评论 -
PSENet笔记
参考PSENet原理介绍原创 2020-08-11 17:41:46 · 184 阅读 · 0 评论 -
PaddleOCR改进识别推理效果对比【废弃】
代码地址:PaddlePaddle/PaddleOCR1 中文测试python3 tools/infer/predict_rec.py \ --image_dir doc/imgs_words/ch \ --rec_model_dir inference/ch_rec_mv3_crnn \ --rec_image_shaoe "3, 32, 320" \ --rec_char_type ch \ --rec_batch_num 30 \ --rec_alg原创 2020-06-24 19:40:11 · 2243 阅读 · 6 评论 -
OCR结果可视化(2)
具体实现参考 paddleocr原创 2020-06-15 20:00:19 · 530 阅读 · 0 评论 -
OCR结果可视化
def draw_ocr_box_txt(image, boxes, txts, drop_score=0.5): img_show = Image.new('RGB', (image.width * 2, image.height), (255, 255, 255)) img_show.paste(image, (image.width, 0, image.width * 2, image.height)) img_show_bak = img_show.copy() ...原创 2020-06-15 19:28:58 · 1115 阅读 · 0 评论 -
psenet论文笔记【未完待续】
0 概要自然场景文本检测有两个挑战:(1)四边形去定位任意形状;(2)文本接近时导致误检测。基于分割的方法可以解决(1)但是不能解决(2)。因此PSENET提出来解决做生意形状的文本检测。psenet为每个文本生成不同尺度的核,逐渐扩展最小尺度核到完整尺寸的文本实例。由于小尺寸核之间有大的几何间隔,psenet能使基于分割的方法有效分割邻近的文本。1 介绍文本检测可粗分为两种...原创 2020-03-17 10:18:58 · 335 阅读 · 0 评论 -
Caffe使用——01 以LeNet训练Mnist数据集为例
1 CNN训练初体验(使用几个命令来训练手写数字数据集)1.1 下载数据、转换数据格式设CAFFE_ROOT为caffe的安装路径。cd $CAFFE_ROOT./data/mnist/get_mnist.sh./examples/mnist/create_mnist.sh上述脚本中的内容完成的工作就是下载并转换数据,暂不做详细介绍。1.2 训练cd $原创 2018-01-15 15:02:28 · 444 阅读 · 0 评论 -
【笔记】【微信OCR(2):深度序列学习助力文字识别】
1 基于字符分割+字符识别1.1 方法首先切分到单字,识别单字的类别,然后将识别结果串联起来。这种化整为零的方法是OCR在深度学习出现之前的几十年里通用的方法。1.2 问题这个方法有两个明显的弊端:1. 切分错误会影响识别性能;2. 单字识别未能考虑上下文信息。1.3 改进为了弥补这两点缺陷,传统方法往往需要对图像进行“过切分”,即找到所有可能是切点的位置,然后再将所有切片和可能的切片组合统统送给单翻译 2017-12-11 13:23:53 · 3363 阅读 · 0 评论 -
jTessBoxEditor说明
tesseract是开源OCR中开发时间最长、使用最多的ocr,就不多说了。 jTessBoxEditor is a box editor and trainer for Tesseract OCR, providing editing of box data of both Tesseract 2.0x and 3.0x formats and full automation of Tesse原创 2017-11-20 16:01:41 · 3385 阅读 · 0 评论 -
【翻译】EAST: An Efficient and Accurate Scene Text Detector
EAST: An Efficient and Accurate Scene Text Detector 论文地址概要以前的场景文本检测方法已经在各种基准上取得了有希望的表现。然而,即使配备深层神经网络模型,它们通常不擅长处理具有挑战性的场景,因为整体性能由管道中多个阶段和组件的相互作用决定。在这项工作中,我们提出了一个简单而强大的流水线,可以在自然场景中产生快速准确的文本检测。管线直接预测完整图像中翻译 2017-11-02 15:06:50 · 2807 阅读 · 0 评论 -
使用SSD训练文本检测
0 介绍根据李斯琦操作步骤总结如下 * 原项目地址:weiliu89/caffe * 所用数据地址:Robust Reading Competition Challenge 2: Reading Text in Scene Images 本文以此数据为例,生成ssd训练所用的lmdb格式。 * 使用ssd进行文本检测的项目:chenxinpeng/SSD_scene_text_detectio原创 2017-06-29 16:23:21 · 2857 阅读 · 1 评论 -
使用rnn实现的OCR开源项目
C++tmbdev/clstmcaffewarpctc-caffetheanoaaron-xichen/cnn-lstm-ctcrakeshvar/rnn_ctctensorflowilovin lstm_ctc_ocrbaidu-research/warp-ctcigormq/ctc_tensorflow_examplesynckey/tensorflow_lstm_ctc_原创 2017-07-26 19:16:58 · 5928 阅读 · 2 评论