OCR
文章平均质量分 57
自己整理的心得笔记,从数据集准备,到训练,可视化,模型测试。后期会逐渐增强新的内容。
Mr.Q
纸上得来终觉浅,绝知此事要躬行。 ---陆游
展开
-
SynthText文本数据详细解析
SynthText 文本识别数据集详细解析原创 2023-04-07 15:02:44 · 988 阅读 · 4 评论 -
将四边形的四个角点重新排序
处理文本检测数据时,遇到icdar2015数据集标注的顶点排序混乱问题,需要重新排序。确保排序后的顶点是:左上角开始,顺序存储。原创 2023-04-03 18:04:28 · 516 阅读 · 0 评论 -
dbnet 论文
核心就是提出了DBnet模块,该模块的作用就是学习一个阈值图即图中每个像素位置的阈值都是变化的),对分割图上每一个像素进行针对性的二值化。(2)准:网络会输出一张分割图之外,还会自动学习出一张对应的阈值图(即图中每个像素位置的阈值都是变化的,自适应的,这个牛批很),该阈值图可对分割图上每一个像素进行针对性的二值化。正常的二值化函数是不可倒的,不可微分的,作者提出的可微分二值化使得此DB模块可参与训练,通过网络学习出一个自适应的阈值图。该论文提出一种实时的、场景文本检测方法。支持不同方向、多种形状的文本。原创 2022-05-04 17:24:36 · 920 阅读 · 1 评论 -
dbnet tensorboard可视化跟进训练过程
可视化训练过程原创 2022-04-23 13:38:59 · 620 阅读 · 0 评论 -
mmocr DBLoss
目录1.balance bce loss2.dice loss3. l1 lossDBLoss由三种loss组成。1.balance bce lossbalance_bce_loss(pred=pred_prob, gt=gt_shrink, mask=gt_shrink_mask)def balance_bce_loss(self, pred, gt, mask): """ pred: (b, w,h) 预测分数image, (0, 1)...原创 2022-04-22 17:10:07 · 265 阅读 · 0 评论 -
dbnet字符检测详细网络结构图
1. dbnet网络原始论文:https://arxiv.org/abs/1911.08947https://arxiv.org/abs/1911.089472. 论文中的网络结构图3. 详细网络结构图原创 2022-04-22 14:22:36 · 466 阅读 · 0 评论 -
mmocr 训练字符检测模型
1. 数据集这里以icdar2015字符检测为例https://blog.csdn.net/jizhidexiaoming/article/details/124149164?spm=1001.2014.3001.55012. config文件配置_base_ = [ '../../_base_/runtime_10e.py', # '../../_base_/schedules/schedule_sgd_1200e.py', '../../_base_/det_m原创 2022-04-20 15:16:12 · 889 阅读 · 0 评论 -
mmocr dataset训练集可视化
1. 可视化效果这里以dbnet网络训练,icdar2015数据集为例。from mmcv import Config, imdenormalizefrom mmocr.datasets import build_datasetif __name__ == '__main__': import cv2 import numpy as np import torch # config = r'D:\code\python\mmocr\confi..原创 2022-04-20 14:49:28 · 609 阅读 · 0 评论 -
mmocr 测试字符检测和识别模型
字符检测和识别原创 2022-04-19 15:09:43 · 4527 阅读 · 10 评论 -
在图像中求多边形区域内平均值(python)
bitmap是网络求出的分数图,_box是多边形位置坐标。(1)先求出box所在的最小外接矩形位置(xmin, ymin, ymin, ymax);(2)生成此外接矩形大小的mask;(3)为了在此mask填充box多边形,需要将box移动到左上角;(4)在bitmap裁剪对应的外接矩形,再与mask对应起来求均值。def box_score_fast(bitmap, _box): """ 在bitmap分数图上,求多边形box位置上的平均值。 Args:原创 2022-04-18 18:04:04 · 1343 阅读 · 0 评论 -
icdar2015 文本定位数据集
介绍icdar2015文本检测数据的格式,和数据处理代码原创 2022-04-13 18:42:14 · 8762 阅读 · 12 评论 -
mmocr初体验
1.安装mmocr官方依赖:pytorch, mmcv,mmdetection.1.1 首先安装pytorch这里默认已经安装好了cuda和cudnnpip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html1.2安装mmcvmmcv安装记录_Mr.Q的博客-CSDN博客_...原创 2022-04-12 11:57:53 · 3365 阅读 · 8 评论