文本检测
文章平均质量分 83
落花逐流水
从事人工智能,模式识别与智能系统
展开
-
DBNet笔记(五)DBNet网络是怎么搭建起来的
参考:https://github.com/WenmuZhou/DBNet.pytorch下面是zhoujun 的 DBNet.pytorch /models/model.py可见通过三个 from import 分别引入了 backbone、neck、head。一下列举的是pytorch的实现,可以对照paddleocr中的实现参考学习,另外opencv4.5之后中也增加了对dbnet的支持。参考:https://github.com/MhLiao/DB/tree/4ac194d03...原创 2021-05-10 22:44:03 · 2014 阅读 · 0 评论 -
PSEnet论文笔记
参考论文地址:《Shape Robust Text Detection with Progressive Scale Expansion Network》论文作者的pytorch版本:PSENet参考博客:CVPR 2019 | 文本检测算法PSENet解读与开源实现tensorflow实现:tensorflow_PSENet在github上还有很多其他版本的实现可以选择骨架的pytorch实现:PSENet.pytorch1、论文介绍PSENet文本检测算法来自论文《Shape Robus原创 2021-04-24 11:13:00 · 304 阅读 · 0 评论 -
DBnet论文笔记
整理笔记原文链接:https://arxiv.org/pdf/1911.08947.pdf官方代码:https://link.zhihu.com/?target=https%3A//github.com/MhLiao/DB周军复现代码:https://link.zhihu.com/?target=https%3A//github.com/WenmuZhou/DBNet.pytorch以上两个版本都是基于pytorch实现的,github上还有基于tensorflow实现的版本。目前文字检测算法原创 2021-04-23 20:02:42 · 640 阅读 · 0 评论 -
DBnet学习笔记(四)会遇到的问题
顺便看了各个版本的dbnet。可以研究pytorch模型如何转libtorch模型,如何转onnx模型,如何转tensorrt模型等。下面会随时记录一些会遇到的问题。1、https://github.com/WenmuZhou/PytorchOCR/blob/master/tools/det_infer.py这个里面在推理前应该加上不计算梯度,否则会报显存不够的错误如下:RuntimeError: CUDA out of memory. Tried to allocate 138.00原创 2020-12-25 10:04:43 · 609 阅读 · 0 评论 -
labelimage的使用
在win10下使用的。下载工具:git clone https://github.com/Programming99119/labelImg-master从anaconda prompt进入到labelimage文件夹:cd /d path-to-labelImg/打开labelImgpython labelImg.py假设要标注yolo格式的标注文件,需要修改data目录下的predefined_classes.txt文件,添加需要的类别。界面左侧第8个图标点击可以切原创 2020-10-09 10:40:01 · 6658 阅读 · 0 评论 -
DBNet学习笔记(三)问题与解决
从大家的提问中学习:https://github.com/WenmuZhou/DBNet.pytorch/issues如何把训练好的模型转换为onnx 老是有不支持的操作#65把model - head 里面的 DBHead.py 中的upsample的mode换成"nearest"即可问答里说的是这一句,现在作者的代码里面已经改好了:module_list = [ nn.Upsample(scale_factor=2, mode='nearest'),.原创 2020-09-28 14:27:03 · 1858 阅读 · 6 评论 -
tensorflow版本的DBnet
项目地址:https://github.com/zonasw/DBNet.git作者在readme中说 tensorflow >= 2.2.0,我测试过tensorflow 2.1.0也是可以用的。1. 测试下载完代码先是安装必要的依赖库,因为作者没有给我们生成requirements.txt,所以不能通过命令:pip install -r requirements.txt来安装需要的依赖库。我们可以直接执行程序:python inference.py程序提示缺什么原创 2020-08-31 17:31:44 · 876 阅读 · 3 评论 -
json数据格式
之后肯定会用到json格式的数据训练模型,现在先记录一下json数据的格式:{ "data_root": "datasets/data/train", "data_list": [ { "img_name": "X00016469670.jpg", "annotations": [ { "polygon": [ [ 98.0, 26.0原创 2020-08-31 16:50:09 · 238 阅读 · 0 评论 -
DBNet学习笔记(二)
后面再补充。参考博客:DB/DBNet:Real-time Scene Text Detection with Differentiable Binarization 一些问题参考博客:论文解读系列二:AAAI 2020 oral最新文本行检测论文DBNet参考博客:DBNet阅读笔记参考博客:DBNet阅读笔记...原创 2020-08-16 18:49:04 · 2280 阅读 · 5 评论 -
DBNet笔记(一)
下载DBNet:https://github.com/WenmuZhou/DBNet.pytorch1. 安装依赖库这个没有需要编译的c++原文件,安装依赖库也比较简单,一般安装依赖库:pip install -r requirement.txt顺便简单介绍一下这个requirement.txt是怎么生成的,这个可不是自己一个一个去找依赖了哪些包,然后手写进去的,如果依赖包足够多的话可能会累到,也有可能自己找的并不全。生成文件pip freeze > requirement原创 2020-08-15 13:07:58 · 699 阅读 · 0 评论 -
win10 编译DBNet
下载DBNet:https://github.com/MhLiao/DBgit clone https://github.com/MhLiao/DB.git需要编译变形卷积与池化,由于原文件是适用于linux的,在windows下可能会出错,参考下面的博客,编辑两个额外的文件setup_conv.py和setup_pool.py。import osfrom setuptools import setupfrom torch.utils.cpp_extension import Build原创 2020-08-15 12:31:49 · 848 阅读 · 0 评论 -
PSENet笔记(二)
上一篇介绍了一下使用开源代码测试,这一篇介绍一下原理。参考:https://www.jianshu.com/p/5668e1e01e26参考:《Shape Robust Text Detection with Progressive Scale Expansion Network》网络结构:论文中主要内容从第3节开始,PSENet的总流水线(管道)如上图所示。网络架构受FPN(Feature Pyramid Network)启发。3.1 管道结构 如上图。3.2 渐进尺度展开..原创 2020-07-14 16:53:31 · 550 阅读 · 1 评论 -
EAST笔记(一)
最近在看文本检测EAST,论文为《EAST: An Efficient and Accurate Scene Text Detector》。先介绍开源程序怎么跑通,理论部分后面会补充。代码地址:https://github.com/argman/EAST ,这是原作者参与的一份tensorflow版本代码,网上还有其他的实现。开源代码一般都是在linux环境下编写、测试、运行。我暂时用windows比较多,所以我都是先在windows下跑通程序的,所以不可避免的会遇到一些问题,不过这些问题大原创 2020-07-12 10:19:08 · 1361 阅读 · 1 评论 -
PSENet笔记(一)
之前关注过文本检测,只了解到CTPN,现在开始看PSENet(Shape Robust Text Detection with Progressive Scale Expansion Network)参考博客:https://mp.weixin.qq.com/s/-zMVO47AL1iKFmF16KsfOwPSENet文本检测算法来自论文《Shape Robust Text Detection with Progressive Scale Expansion Network》,2018年7月发表于a原创 2020-07-03 17:37:53 · 970 阅读 · 4 评论