DL小试牛刀
DL小试牛刀
业余狙击手19
图像算法菜鸟,点滴积累成就硕果累累。
展开
-
MaskRCNN做文本检测?你试过吗?
之前用MaskRCNN检测了版面图片中的图片、表格、公式,整体效果还可以,想想能不能对MaskRCNN稍作修改,让它来检测文本行?带着这个好奇心,我出发了。第一步,标注数据 目前来说,数据是学习DL的重要资源,没有数据,只能算理论上了解DL,用实际数据实践是学习巩固DL理论知识的重要一环。 下面是将版面图片中的文本行标注后的结果。第二步,改动代码&训练此步省略...第三步,测试结果...原创 2020-11-14 22:49:43 · 769 阅读 · 3 评论 -
MaskRCNN在多个实例数据集上实践
MaskRCNN没有FasterRCNN、YOLOv3好训练原创 2020-11-10 13:52:10 · 1004 阅读 · 16 评论 -
EAST文本块图片文本检测实践
uNet源码解析原创 2020-08-03 20:20:59 · 503 阅读 · 0 评论 -
CTPN文本块图片文本检测实践
CTPN自然场景实践原创 2020-07-19 15:54:46 · 410 阅读 · 0 评论 -
YOLOv3与FasterRCNN结果对比2
之前发布过一篇“YOLOv3与FasterRCNN结果对比”,那篇文章中YOLOv3的检测效果整体没有FasterRCNN效果好,尤其是公式的检测效果,正确率很低。针对这一情况,对源码做了一些改动,重新进行了训练,这次得到的检测结果和FasterRCNN相当。下图左边是YOLOv3得到的结果,右边是FasterRCNN得到的结果。...原创 2019-12-27 19:27:49 · 2576 阅读 · 3 评论 -
YOLOv3与FasterRCNN结果对比
下图左边是YOLOv3得到的结果,右边是FasterRCNN得到的结果。本来是想将对比图的不同之处标记出来,并逐一分析一下每张图每个算法的优劣的,但是感觉那样太麻烦了,为了节省时间,还是简单粗暴的只贴图吧。有些图在细节方面YOLOv3的效果要比FasterRCNN的效果好,但整体上YOLOv3的检测效果没有FasterRCNN好。...原创 2019-12-23 08:21:15 · 7296 阅读 · 1 评论 -
YOLOv3训练自己的数据集
之前用Faster RCNN训练了自己的数据集,检测图中的图片、表格、公式,具体检测效果可以查看公众号以前发表的文章,这里我就不链接了,链接过来链接过去太乱了。 FasterRCNN属于Two-stage目标检测算法,Two-stage算法在精度上较高,在时间上花费较大。Yolov3属于One-stage目标检测算法,相对于Two-stage算法,速度较快,可以达到实时的效...原创 2019-12-23 08:20:24 · 441 阅读 · 0 评论 -
FasterRCNN与CTPN结果相结合2
之前用FasterRCNN检测版面的图片、表格、公式,用CTPN检测文本行,效果还不是太好,最近做了一些改进,以下左边是改进后的效果图,右边是改进前的效果图,此次改进主要在文本检测方面,图片表格公式效果还是和之前的一样:...原创 2019-12-01 17:05:37 · 1003 阅读 · 6 评论 -
FasterRCNN与CTPN结果相结合
这篇文章应该在“FasterRCNN与CTPN结果相结合2”之前发表的,但是之前发的未经过审核,所以时间顺序上颠倒了。 之前的文章用FasterRCNN检测了图片、表格、公式;用CTPN检测了文本行。之前是分别显示各自的检测效果,不是太直观,这里将两个检测效果合在一起,这样可以更直观的显示。 下列图片检测效果还不是很完美,达到更好的结果还需要继续改...原创 2019-12-03 08:09:04 · 974 阅读 · 2 评论 -
FasterRCNN训练自己的数据集2
尝试用FasterRCNN做版面分析,由于缺少大量的标注数据,手动标注数据量少也不起什么作用,鉴于之前做过版面分析,且效果还行,之前版面分析效果图见:OCR版面分析效果图(一)OCR版面分析效果图(二) 考虑使用之前的处理结果(去除效果差的)做标注数据(由于我之前的版面处理中文本不是按文本段落切分的,而是以文本行切分,而每页文本行数目又太多,大小情况比较复杂,所以暂时不把...原创 2019-11-09 19:49:44 · 1117 阅读 · 0 评论 -
FasterRCNN训练自己的数据集
为目标检测制作PASCAL VOC2007格式的数据集不能再详细!!!手把手教你用Faster-RCNN训练自己的数据集DL | Faster R-CNN 训练自己的数据集遇到的问题总结尝试用FasterRCNN做版面分析,由于缺少大量的标注数据,手动标注数据量少也不起什么作用,鉴于之前做过版面分析,且效果良好,之前版面分析效果图见:OCR版面分析效果图(二)OCR版面分...原创 2019-10-24 08:23:06 · 1643 阅读 · 0 评论 -
CTPN训练自己的数据集
文本检测算法一:CTPNCTPN源码解析1-数据预处理split_label.pyCTPN源码解析2-代码整体结构和框架CTPN源码解析3.1-model()函数解析CTPN源码解析3.2-loss()函数解析CTPN源码解析4-损失函数CTPN源码解析5-文本线构造算法构造文本行CTPN训练自己的数据集使用CTPN检测文本行,整体来说效果还可以,但目前还没有达到用...原创 2019-11-08 19:08:46 · 4245 阅读 · 1 评论 -
MSER+NMS 文本检测(身份证+发票+火车票)
此篇文章不细说MSER和NMS原理,以实战为主。 MSER是最大稳定极值区域:是对一幅灰度图像(灰度值为0~255)取阈值进行二值化处理,阈值从0到255依次递增。阈值的递增类似于分水岭算法中的水面的上升,随着水面的上升,有一些较矮的丘陵会被淹没,如果从天空往下看,则大地分为陆地和水域两个部分,这类似于二值图像。在得到的所有二值图像中,图像中的某些连通区域变化很小,甚至没有...原创 2019-06-25 17:58:21 · 2566 阅读 · 0 评论 -
DL练习8—seq2seq小例子
本例参考某教学视频和某知乎文章,下载完他的github代码后找不到文章地址了,罪过罪过,自己敲了一遍代码并跑了一遍,添加了一些注释,再通过整理博客的方式加深理解。该例子的主要目的是通过seq2seq训练一个模型,解决将输入字符串(乱序)按字母顺序排序输出的问题,例如“open”->enop。当然用简单的算法也可以很方便的将字符串排序输出,这不主要目的是为了理解seq2seq工作原理嘛!用...原创 2019-09-09 20:32:07 · 1317 阅读 · 7 评论 -
DL练习7—CNN实现50类汉字分类模型训练
一,待训练的汉字数据集:二,每个汉字文件夹里有1000-3000张图像:三,源代码:该CNN网络总共6层,3层卷积层,3层全连接层。# !/usr/bin/env python# coding: utf-8import numpy as npimport osimport tensorflow as tfimport cv2from tensorflow.p...原创 2019-07-01 19:08:54 · 1461 阅读 · 3 评论 -
DL练习6—CNN实现0-9数字分类模型的训练
待训练图片提取图片特征,存成npy文件import multiprocessingimport os, time, randomimport numpy as npimport cv2import osimport sysfrom time import ctimeimport tensorflow as tfimage_dir = r"D:/sxl/处理图片/汉字...原创 2019-04-30 19:18:59 · 1486 阅读 · 0 评论 -
DL练习5—基于LSTM+CTC的不定长验证码识别
原文地址:https://blog.csdn.net/zgcr654321/article/details/84634382主要在此篇文章的基础上进行学习的,非常感谢博主共享。原代码原博客里有,我贴一下我自己实际运行的代码,相对于原代码有一些改动。一,生成的图片:二,代码: 主要贴了模型训练的代码,图片生成代码和原文的一样。# -*- coding...原创 2019-01-11 20:06:03 · 2305 阅读 · 13 评论 -
DL练习4—基于LSTM的验证码识别
一,基本版本1.1 训练图片示例:1.2 代码:#-*- coding:utf-8 -*import tensorflow as tfimport osimport randomimport numpy as npfrom PIL import Imagepath = os.getcwd() #项目所在路径captcha_path = path + '/tra...原创 2018-12-28 21:10:35 · 1875 阅读 · 0 评论 -
DL练习3—基于RNN&LSTM的MNIST手写字体识别
点击获取基于RNN&LSTM的MNIST手写字体识别源代码(GitHub)这篇文章就不说RNN和LSTM的原理了,现在网上这类文章铺天盖地的。在这里把实际代码跑一下,同时对代码加了一些注释,并看一下执行效果,主要是通过实际代码加深对RNN和LSTM的理解。一,基于RNN的MNIST手写字体识别1.1 代码import tensorflow as tffrom tenso...原创 2018-12-23 10:02:48 · 1190 阅读 · 2 评论 -
DL练习2—基于CNN的验证码识别
点击获取基于CNN的验证码识别源代码(GitHub) 程序中生成的验证码图片示例:(程序边运行边生成图片,可以无限生成,不用担心样本不够的问题,也可以选择性保存在本地) 以下几个版本的代码有所差别,但核心功能一样。一,CNN验证码识别原始版 二,CNN验证码识别-改进版2.1 代码 改动了里面的部分代码,添加了注释和断点续训功能,由...原创 2018-12-13 17:58:41 · 1521 阅读 · 3 评论 -
DL练习1—基于CNN的MNIST手写字体识别(Tensorboard可视化版)
点击获取基于CNN的MNIST识别源代码(GitHub) 一,CNN等理论参考:卷积神经网络(CNN) 二,Tensorboard可视化代码:# coding: utf-8import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data#载入数据集mnist ...原创 2018-12-13 17:58:03 · 1038 阅读 · 1 评论