- 博客(4)
- 资源 (8)
- 收藏
- 关注
原创 基于CRNN+Attention 的英文单词识别(Attention-OCR)
前言:针对OCR问题,有各种各样的检测和识别网络,虽然架构各不相同,但是基本思想都是通过CNN网络提取文本特征,然后通过RNN网络学习特征之间的关系,从而实现文本识别。目前已经完成CRNN网络的相关工作,在生成的样本上取得较好的识别效果,但是在应用于扫描生成的PDF文件进行识别时,错误率还是很高的,可能的原因是样本不够贴近具体的应用场景,所以样本中应该包含来自真实场景的采样,或者在生成数据时应...
2019-03-30 16:42:29 8546 4
原创 CRNN原理以及tensorflow、keras实现
目标检测是计算机视觉领域的一个大佬,就连大名鼎鼎的图像识别从某种程度上可以看做目标检测的一个特例,即图像中 only one object 同时不需要检测目标在图像中的位置。常见的 object detection 都是关于动物(猫)交通工具(飞机)常规物体(杯子)等实物,即可以通过一些视觉特征如轮廓、形状等准确的识别出物体。然而,但是,如果图像中出现了文本信息呢?如何识别视觉图像中的文本信息。显...
2019-03-16 23:04:04 6668 8
原创 文本处理之句子切分-日语和英语
前言:神秘力量出现,博主转投NLP领域,干起了文本类型数据处理和识别。由于博主之前一直在视频、图像领域挖坑对NLP这一块儿相当无知,所以,那么,就从最简单的拆分句子开始吧。背景:为什么要拆分句子?对于大段的文本,一般情况下都是多个句子合在一起的,如果把它们当成一句语来处理,即作为RNN网络的一条数据有些太“长”,所以我们要对长文本进行切分使其尽可能的“短”,但是为了保持句子意思的...
2019-03-09 16:09:37 3087
原创 算法--排序python实现
记录一些基本排序算法,全当是复习巩固了。1:选择排序核心思想:每一次都从无序的序列中挑选中最小值,并把它放到相应的位置上。假设有一堆数字卡片,卡片是无序排列的,现在需要按照卡片上数字从小到大排列。算法步骤:1. Find the smallest card. Swap it with the first card.2. Find the second-small...
2019-03-02 21:01:41 125
pdf文件单页转换成图片
2024-04-08
基于openCV的圆形表盘示数读取
2019-01-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人