图片文字识别OCR
文章平均质量分 52
本文主要是记录,分享前面做的图片文字识别包括传统的OCR(图片文字提取)以及深度学习双向LSTM图片文字识别
FishBear_move_on
github 地址 https://github.com/Jayhello
展开
-
CTPN docker/nvidia-docker 安装
本文主要是记录使用docker/nvidia-docker安装深度学习图片文字识别,开发运行环境. 在做图片文字识别的,需要用到CTPN以及crnn,服务器是ubuntu16的,但是上述两种框架(github现有的)只能运行在ubuntu14上面。考虑到,发布等问题,决定使用docker在ubuntu16搭建ubuntu14 cuda7.5 cudnn3开发运行环境。服务器系统为ubuntu1原创 2018-01-21 19:39:29 · 1565 阅读 · 1 评论 -
crnn docker/nvidia-docker 安装
本文主要是记录使用docker/nvidia-docker安装深度学习图片文字识别,开发运行环境. 在做图片文字识别的,需要用到CTPN以及crnn,服务器是ubuntu16的,但是上述两种框架(github现有的)只能运行在ubuntu14上面。考虑到,发布等问题,决定使用docker在ubuntu16搭建ubuntu14 cuda7.5 cudnn3开发运行环境。 crnn的原创 2018-03-22 19:29:11 · 1194 阅读 · 1 评论 -
Tesseract ocr文字识别
前面很早做了图片的文字识别主要用到了开源框架Tesseract,当然做OCR之前先要定位图片文字。先上个图: 工作中项目组一般使用java因此代码,下面贴出java代码,最简单的图片识别:package com.recognition;import java.awt.*;import java.awt.image.BufferedImage;import java.io.File;impo原创 2017-09-01 19:42:05 · 4733 阅读 · 1 评论 -
Tesseract文字训练,以及样本生成
前面用做Tesseract做文字识别的时候,一般网上教程称使用jTessBoxEditor训练(最终我试验发现对于中文的图片文字识别而言训练基本没什么卵用)当然使用jTessBoxEditor训练新的文字还是可以的,当时我发现jTessBoxEditor训练基本的配置文件基本是文字以及文字的坐标于是我使用python脚本生成了对应的训练图片以及配置文件。先上个图: yahei_font2.box配原创 2017-09-01 20:01:37 · 5454 阅读 · 1 评论