OCR实践
文章平均质量分 89
主要记录ocr中,文本检测与文本识别相关实践
小俊俊的博客
沉迷于摸鱼的程序员
展开
-
pycharm中配置paddleocr记录
pycharm中配置paddleocr记录一、环境及电脑配置1.python32.pycharm3.ubntu204.gpu-cuda11.1-cudnn二、下载代码1.链接:https://github.com/PaddlePaddle/PaddleOCR2.解压unzip PaddleOCR-release-2.4.zip三、pycharm中配置环境1.根据requirements.txt建立虚拟环境之后该路径中就是paddleocr的环境了。也可以pycharm中创建虚拟环原创 2022-03-26 10:35:10 · 4804 阅读 · 0 评论 -
CTPN代码阅读之split_label.py
CTPN代码阅读之split_label.pysplit_label.py的作用是将每一个标记框切分成宽为16的矩形框并且resize输入图像大小一,数据切分效果原始:需要达到的效果:二,代码import osimport sysimport cv2 as cvimport numpy as npfrom tqdm import tqdmsys.path.append(os.getcwd())print(os.getcwd())#from utils.prepare.ut原创 2020-05-17 21:41:40 · 344 阅读 · 0 评论 -
文本检测CTPN训练自己的数据集
CTPN训练自己的数据集代码来自:eragonruan/text-detection-ctpn一,下载预训练模型下载链接:预训练模型选择VGG16,但是貌似下载特别慢。下载VGG net的预训练模型解压并将其放在data / vgg_16.ckpt中。二,准备自己的训练集目的:将原始数据中四个点框住的文本切分为16份。1.我的原始数据是利用labelimage生成的xml文件格式,需要先将xml文件中的坐标信息转化为txt格式,在我的前几篇文章中有参考代码。生成的坐标信息如图所示:至于原创 2020-05-17 21:19:05 · 3505 阅读 · 34 评论 -
CTPN的demo.py实现过程记录
CTPN的demo.py实现过程记录最近又开始ocr相关的任务了,记录一下过程。本次使用的代码来自CTPN一,下载代码这个是tensorflow版本的代码,先看一下环境配置要求吧。备注:gcc与g++也要求在6.0以上,否则会报错。二,编译在根目录下输入以下:cd utils / bboxchmod + x make.sh./make.sh目的是生成.os文件。如图:三,下载作者训练好的ckpt1.ckpt文件2.将checkpoints_mlt /放在text-detec原创 2020-05-17 20:31:49 · 568 阅读 · 10 评论 -
rcnn代码—demo.py
rcnn代码—demo.py个人理解学习,仅供参考!一、总体流程总体流程如下:二、main主函数备注如下:if __name__ == '__main__': config, args = parse_arg()#初始化配置信息 device = torch.device('cuda:0') if torch.cuda.is_available() else torch.device('cpu')#选用设备 model = crnn.get_crnn(con原创 2020-12-05 14:33:01 · 902 阅读 · 4 评论 -
rcnn代码—train.py
rcnn代码—train.py个人理解学习,仅供参考!一、总体流程总体流程如下二、get_crnn代码解读1.函数入口在train.pymodel = crnn.get_crnn(config)通过get_rcnn函数与配置信息(config)构建基础模型2.get_rcnn函数def get_crnn(config): model = CRNN(config.MODEL.IMAGE_SIZE.H, 1, config.MODEL.NUM_CLASSES + 1, confi原创 2020-12-04 21:48:13 · 1103 阅读 · 0 评论 -
字体风格迁移MC-GAN运行记录
一,代码代码二,环境配置Linux or macOSPython 2.7#python3不行CPU or NVIDIA GPU + CUDA CuDNNpip install visdompip install dominatepip install scikit-image三,下载文件mkdir FontTransfercd FontTransfergit clone https://github.com/azadis/MC-GANcd MC-GAN下载文件,在MC-GAN文原创 2020-12-02 11:27:49 · 506 阅读 · 2 评论 -
传统文本检测并合并三通道
传统文本检测并合并三通道# -*- coding: utf-8 -*-import cv2import numpy as npimport globimport os.pathdef text_connect(imagedir,outdir): # 读取图片 img = cv2.imread(imagedir) ##成灰度图 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 利用Sobel边缘检测生原创 2020-11-20 09:25:08 · 162 阅读 · 0 评论