liuxiaoheng1992的博客

欢迎加入OCR交流群:785515057

TextBoxes与TextBoxes++算法详解

这是两篇文章,因为这两篇文章大部分是相同的所以写一块了。 TextBoxes 《TextBoxes: A Fast Text Detector with a Single Deep Neural Network 》发表于AAAI2017 github地址:https://github.co...

2019-01-30 15:12:25

阅读数 62

评论数 0

轻量级深度学习网络概览

调研了一下最近的一些轻量级网络,列举并简单介绍各个网络的设计思路 PVANET 2016年1月在arxiv网站第一次提交 文章地址:https://arxiv.org/abs/1608.08021 代码链接:https://github.com/sanghoon/pva-faster-rc...

2019-01-17 17:23:30

阅读数 901

评论数 0

PixelLink: Detecting Scene Text via Instance Segmentation算法详解

PixelLink: Detecting Scene Text via Instance Segmentation,该文章发表在AAAI2018上,代码地址:https://github.com/ZJULearning/pixel_link 该篇文章灵感来自于图像分割算法和之前CVPR2017的...

2018-12-31 11:10:11

阅读数 111

评论数 0

SegLink(Detecting Oriented Text in Natural Images by Linking Segments)算法详解

《Detecting Oriented Text in Natural Images by Linking Segments》是和EAST同年的一篇发表在CVPR2017的OCR论文。代码地址:https://github.com/bgshih/seglink,这是该文章其中一个作者提供的tens...

2018-12-30 12:07:11

阅读数 127

评论数 0

SWT(Detecting Text in Natural Scenes with Stroke Width Transform)算法详解

《Detecting Text in Natural Scenes with Stroke Width Transform》,这是微软公司的一篇发表于CVPR2010的文章,使用传统方法来检测自然场景中的文本。代码地址:https://github.com/aperrau/DetectText ...

2018-12-27 20:48:43

阅读数 59

评论数 0

Levenshtein distance(编辑距离)

基本介绍 Levenshtein distance是一种度量两个序列(字符串)差异大小的方法。 该方法定义如下: 两个序列(以单词为例,这里序列也可以表示一个句子)的Levenshtein distance是在使用一个单词修改为另一个单词时,通过编辑单个字符(如插入,删除,修改)所需要的最小...

2018-11-06 14:20:25

阅读数 101

评论数 0

CTC算法详解

和其它文章初衷一样,网上解释很多,还有原文,但是讲的不是很明白,在看完几篇参考博客后特此记录 简介 先拿语音识别任务来说,如果现在有一个包含剪辑语音和对应的文本,我们不知道如何将语音片段与文本进行对应,这样对于训练一个语音识别器增加了难度。 为了解决上述问题,我们可以先制定一个规则,例如“一...

2018-11-02 19:49:59

阅读数 509

评论数 0

git lfs安装及使用方法

什么是git LFS LFS是Large File Storage的缩写,用了帮助git管理大的文件 原理:不同于每次保存diff,如果是模型或者一些设计大文件,改变一点,对于仓库来说会增加很大的体积,不一会就能几个G。对于git lfs来说,在使用git lfs track命令后,git p...

2018-10-19 15:59:02

阅读数 1589

评论数 0

Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation 论文详解

Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation发表于2018年的cvpr,该文章通过结合角点检测和图像分割来对图像文字进行定位 Introduction 目前文字定位方法分为...

2018-10-10 16:17:28

阅读数 205

评论数 0

OCR EAST: An Efficient and Accurate Scene Text Detector 自然场景下的文字识别算法详解

最近研究OCR,有篇比较好的算法文章引起我的注意,《EAST: An Efficient and Accurate Scene Text Detector》,该文发表在2017年CVPR上。代码地址:https://github.com/argman/EAST,这是原作者参与的一份tensorfl...

2018-09-27 17:57:32

阅读数 516

评论数 0

中文文字检测与识别的评测方法

在ICDAR的一个答疑网页(F.A.Q)中有相关介绍,其中文本定位分为几个挑战,分别称为Challenges 1、Challenges 2和Challenges 4,不同的挑战有不同的评价方法。 下面先简单介绍一下这三个挑战: Challenges 1(Born-Digital)的数据来...

2018-09-12 13:16:52

阅读数 528

评论数 0

PSENet(Shape Robust Text Detection with Progressive Scale Expansion Network)论文详解

《Shape Robust Text Detection with Progressive Scale Expansion Network》,2018年7月发表于arxiv,代码地址:https://github.com/whai362/PSENet 目前该仓库没有给出源码,只有一些原理图和实验...

2019-02-18 21:18:53

阅读数 7

评论数 0

OpenCV踩坑之findContours

调用方式如下: _, contours0, hierarchy = cv2.findContours(im, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) 错误如下: ValueError: need more than 2 values to unpa...

2019-02-01 13:04:43

阅读数 32

评论数 0

CTPN(Detecting Text in Natural Image with Connectionist Text Proposal Network)算法详解

《Detecting Text in Natural Image with Connectionist Text Proposal Network》,发表在ECCV2016,算是一个使用比较多效果较好的较为经典的一个文字检查算法了,CVPR2017年中的一篇名为SegLink的文章灵感也来自于此。...

2019-01-09 20:30:34

阅读数 44

评论数 0

关于CTPN论文实现cpu版本的编译问题

《Detecting Text in Natural Image with Connectionist Text Proposal Network》,发表在ECCV2016,算是一个使用比较多效果较好的较为经典的一个文字检查算法了。 本人目前也在阅读该论文tensorflow版本的代码,该代码的...

2019-01-08 11:45:31

阅读数 35

评论数 0

tensorflow mac和Linux上的简便安装

基于VirtualEnv的安装 首先, 安装所有必备工具: # 在 Linux 上: $ sudo apt-get install python-pip python-dev python-virtualenv # 在 Mac 上: $ sudo easy_install pip ...

2019-01-08 11:38:41

阅读数 40

评论数 0

Learn OpenCV之Rotation Matrix To Euler Angles

本文要介绍的是3×33 \times 33×3的旋转矩阵与欧拉角(Euler Angles)之间的相互转换方法。 本文其实和OpenCV关系不大,但是译者曾经花了一些时间解决自己在这部分知识上的困扰,看见原博客写的还不错,决定还是记录一下 一个旋转矩阵能表示三个角度自由度,即绕着三维的坐标轴的三个...

2018-12-27 10:34:47

阅读数 56

评论数 0

Learn OpenCV之WarpTriangle

这篇文章将讲述的是如何将一个图片内的三角形内容映射到另一个图片内的不同形状的三角形内。 在图形学的研究中,研究者常常进行三角形之间的变换操作,因为任意的3D表面都可以用多个三角形去近似表示。同样的,图片也可以分解成多个三角形来表示。但是在OpenCV中并没有一个直接可以将三角形转换为另一个三角形...

2018-12-25 19:52:01

阅读数 23

评论数 0

Learn OpenCV之Heatmap

本文是利用热图(Heatmap)分析视频序列的标定。 注意,这里目的不是标定而是分析标定好的数据,或者也可以是检测的结果数据 文章结构是这样的,先详细的解释一下热图分析有什么用,根据一些具体的应用实例给出相应的教程和Python实现代码。 为什么要用热图对Logo检测结果进行分析 在计算机视觉中,...

2018-12-21 12:15:06

阅读数 114

评论数 0

Learn OpenCV之Convex Hull

这篇文章讲的是如何寻找给出的点集的凸包(Convex Hull),先简单介绍算法原理,之后利用OpenCV实现一个找凸包的程序。 什么是凸包(Convex Hull)? 这个问题可以分成两个概念理解,Convex 和 Hull 凸形状(Convex object)就是没有大于180°的内角的形状。...

2018-12-20 20:40:48

阅读数 45

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭