基于CRNN+Attention 的英文单词识别(Attention-OCR)

前言: 针对OCR问题,有各种各样的检测和识别网络,虽然架构各不相同,但是基本思想都是通过CNN网络提取文本特征,然后通过RNN网络学习特征之间的关系,从而实现文本识别。目前已经完成CRNN网络的相关工作,在生成的样本上取得较好的识别效果,但是在应用于扫描生成的PDF文件进行识别时,错误率还是很...

2019-03-30 16:42:29

阅读数 91

评论数 0

CRNN原理以及tensorflow实现

目标检测是计算机视觉领域的一个大佬,就连大名鼎鼎的图像识别从某种程度上可以看做目标检测的一个特例,即图像中 only one object 同时不需要检测目标在图像中的位置。常见的 object detection 都是关于动物(猫)交通工具(飞机)常规物体(杯子)等实物,即可以通过一些视觉特征如...

2019-03-16 23:04:04

阅读数 196

评论数 0

文本处理之句子切分-日语和英语

前言: 神秘力量出现,博主转投NLP领域,干起了文本类型数据处理和识别。由于博主之前一直在视频、图像领域挖坑对NLP这一块儿相当无知,所以,那么,就从最简单的拆分句子开始吧。 背景: 为什么要拆分句子?对于大段的文本,一般情况下都是多个句子合在一起的,如果把它们当成一句语来处理,即作为R...

2019-03-09 16:09:37

阅读数 27

评论数 0

算法--排序python实现

记录一些基本排序算法,全当是复习巩固了。 1:选择排序 核心思想:每一次都从无序的序列中挑选中最小值,并把它放到相应的位置上。 假设有一堆数字卡片,卡片是无序排列的,现在需要按照卡片上数字从小到大排列。 算法步骤: 1. Find the smallest card. Swap...

2019-03-02 21:01:41

阅读数 20

评论数 0

c++ 之赋值运算符函数

题目: 如下为类型CMyString的声明,要求为该类型添加赋值运算符函数。 class CMyString { public: CMyString(char* pData = nullptr); CMyString(const CMyString&...

2019-02-15 16:55:22

阅读数 14

评论数 0

基于openCV和python的车牌字符切割

摘要 在车牌识别以及别的需要文本识别的场景中都需要对图像中的文本进行正确的切分以便于下一步的识别,类似人的阅读计算机在识别文本时只能一个一个的来,精准的切分字符是识别的必要条件。   算法 假设我们已经从包含整辆车的图片中得到了只包含车牌的区域,如图一所示,那么任务就是如何把图一中出现的字...

2019-02-15 00:09:50

阅读数 205

评论数 0

基于OpenCV的圆形表盘示数的自动读取

背景: 来源于一个真实的需求,一些设备需要通过读取诸如气压表的示数来判断设备是否正常工作或者确定是否达到加工产品所需的环境。一直以来都是依赖人工读取示数,车间工人定时巡检读表,相当于等间隔采样,但是示数的变化是一个连续值,用离散的采样值近似连续值总会漏掉一些信息,太密集的采样又是对人力的极大消耗...

2019-01-28 17:26:46

阅读数 283

评论数 0

算法学习----day01如何确定一个点在多面体内

博主一直从事视频图像处理相关工作,由于一些不可抗力因素,必须马上立刻对一些 computer algorithms 有深入的了解,退后,我要开始学习了。 Today‘s  subject:How to check if a given point lies inside a polygon 中文...

2019-01-15 21:31:08

阅读数 148

评论数 0

FaceNet原理和TensorFlow实现

写在前面: 人脸识别、验证、关键点检测是计算机视觉领域元老级的课题,前人提出了大量优秀的算法来实现在不同场景不同光照强度不同分辨率等situation下的人脸识别、验证或关键点检测。据博主所知,基于OpenCV的dlib是一个很优秀的开源库,当然还有很多优秀的算法和算法库,不过这不是本文的关注点...

2019-01-12 23:06:16

阅读数 158

评论数 0

对--「数据结构与算法 2」| 单链表其实真的很简单。--的一些补充。

原文地址:https://blog.csdn.net/u013486414/article/details/83099153#comments 作者的理论解释部分清晰易懂,对概念讲解的很透彻,但是作者的代码在实测时出现了以下问题: (1)头节点与头指针混淆。 (2)头节点与列表的第一个结点重...

2018-12-06 14:26:51

阅读数 32

评论数 0

论文--NetVLAD: CNN architecture for weakly supervised place recognition--阅读笔记。

关键词:NetVLAD Pooling layer                  triplet-loss                     fmax function                   weakly-supervised-learning 摘要: 针对大规模的位置...

2018-09-05 10:16:10

阅读数 650

评论数 0

python-GIL-多线程很鸡肋!!

关键词:GIL、Thread、Ticks、Check、Signal。 主要介绍python多线程和GIL的一些东西。 总结: •CPython的线程是操作系统的原生线程。在Linux上为pthread,在Windows上为Win thread,完全由操作系统调度线程的执行。一个Python解...

2018-08-23 20:09:10

阅读数 204

评论数 0

Ubuntu-有线网络无法上网的问题解决方法汇总

转载别人的,写的很详细很全,值得收藏。 https://blog.csdn.net/u010025211/article/details/75043216 另外,说一下在设置静态IP时,点击右上角的网络按钮,然后点击“编辑连接”,然后在弹出的窗口中选择“增加”,弹出选择框,选择“以太网”,然后...

2018-08-20 11:47:57

阅读数 2164

评论数 0

opencv+颜色直方图+相似图像比对

这个是之前学习openCV时做过的,时间长了怕找不到,还是写下来的好。 首先,图像直方图是什么?图像直方图是用以表示数字图像中亮度分布的直方图,标绘了图像中每个亮度值的像素数。 直方图的意义: 1、直方图是图像中像素强度分布的图形表达方式。 2、它统计了每一个强度值所具有的像素个数。 o...

2018-08-13 15:30:38

阅读数 1855

评论数 0

MSER+SIFT 图像的特征向量提取 python

在做图像检索时,需要提取图像的特征向量。传统的局部特征描述子如SIFT、SURF等,如果不做别的处理,往往会得到大量的特征向量,虽然特征向量的数目越多,对图像的描述越精确,检索的准确率较高,但是这也会增加硬件成本同时也会耗费大量的计算时间。 从博主的试验结果来看,单张图384×256大小,提取出...

2018-07-24 11:54:48

阅读数 862

评论数 9

VLAD学习总结和python实现

工作需要,研究了一些很经典的图像检索算法,逐一记录下来,方便自己复习和大家交流。 这篇博文是关于VLAD(vector of locally aggregated descriptors),即聚合局部描述子的向量,是一种利用图像的局部描述子如:SIFT、SURF、ORB等,做一些聚合的操作,然后...

2018-07-11 18:09:21

阅读数 1777

评论数 43

乘积量化学习和实战总结

由于一直在做视频检索相关的工作,不可避免的要和各种图像检索的算法打交道(因为视频最终还是要解码成图像的形式)。乘积量化作为一种很优秀的图像编码方法,博主自然不会错过。在折腾了长达3个月之后,有所小成,特此记录下来,权当复习,同时也希望与相关领域的道友进行交流。一、为什么要用乘积量化乘积量化就是一种...

2018-07-05 17:31:37

阅读数 891

评论数 3

基于自适应聚类的视频关键帧的抽取

由于工作需要,要做海量视频检索。但是视频是一种复杂的文件形式,不能直接拿来做检索。所以,要先将视频解码成图像的形式,借用图像检索即以图搜图的思想来实现,所以如何把很长的视频文件解码并提取关键帧就显的尤为重要。博主在查阅大量论文资料的基础上,总结出了一个切实可行的方案:即利用聚类的思想,把从视频中解...

2018-05-11 15:48:51

阅读数 736

评论数 2

部署已经训练好的caffe网络用于图片分类

博主最近在学习caffe,所以会将每一个关键节点都记录下来,方便自己查看,也希望能够帮到有需要的人!首先,这篇文章是基于你已经能够用自己的数据集训练caffe中现成的深度网络,如letnet、caffenet等。如果这一步你还没有实现,建议查看博主之前的博客,有关于这一块的过程。在你成功的进行了训...

2018-04-19 14:46:38

阅读数 135

评论数 0

caffe 训练自己的数据集或者是imgnet上的数据集

参考这篇优秀的博文,基本上都能够实现训练自己的数据集以及标注过程。https://blog.csdn.net/qq_27923041/article/details/54139887#comments这个小哥的过程很是详细,我不在这里重复,仅在此做一些细节上的补充和说明。首先是数据集的获取,我直接...

2018-04-18 11:10:55

阅读数 213

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭