字符识别OCR研究
文章平均质量分 70
zhubenfulovepoem
机器人研究和arm嵌入式研究
展开
-
字符识别OCR研究二:简单案例分析 字符识别
图像描述:单张图片,信息量比较大,字符区域明显。 样本以及待识别的样本的处理过程: 首先二值化,阈值100时的效果图。第一步:检测图像Blob块,去掉图像左上端的黑快方法:直接对二值图像进行从左上开始的像素扫描,连续的黑色像素值,遇到白像素时停止扫描,然后对扫描遇到的黑色像素点赋值为白色像素。 第二步:确定字符在竖直方向上的跨度:将图像对竖直方向上做投影原创 2012-02-21 19:52:58 · 8704 阅读 · 2 评论 -
FCN + Multilabel Caffe方法综述
Multilabel Caffe方法综述说明:一年前项目总结。法一:FCN的车牌图像识别,end-to-end 目标定位、图像识别优点:全图识别带分割框代码位置:E:\FCN+MultiLabel\FCN+detect步骤:https://github.com/CrazyVertigo/digits2.0To train:Git clone and put原创 2017-12-26 15:28:57 · 3190 阅读 · 2 评论 -
FCN的车牌图像识别,end-to-end 目标定位、图像识别
上图,分割结果和识别结果都非常好!!!一、样本与label制作:效果如下图: 分别一一对应: Fully Convolutional Networks forSemantic Segmentation1.概览&主要贡献 提出了一种end-to-end的做semantic segmentation的方法,简称FCN。 如下图所示,直接拿segmentation 的 ground原创 2017-11-21 20:49:31 · 5460 阅读 · 8 评论 -
cuda-covnet 深度学习工具的权值转化为txt 方便cpp源码调用
# Copyright (c) 2011, Alex Krizhevsky ([email protected])# All rights reserved.## Redistribution and use in source and binary forms, with or without modification,# are permitted provided that t原创 2017-11-21 20:13:03 · 632 阅读 · 0 评论 -
银行卡号识别Bank Card Rec 主要功能接口说明
Bank Card Rec 主要功能接口说明:说明:如果需要其他接口都可以封装出来主接口/*调用识别之前先初始化一次*/int init_all (); /* 调用识别,读取图像版本函数:picture_file-输入图像名字,支持bmp、jpg、png、tif等等;s_result为输出结果。进行了很好的封装,客户只需要调用这个函数,会自动进行银行卡定位,银行卡矫正,银行卡号区域原创 2017-11-21 19:53:52 · 3053 阅读 · 1 评论 -
cuda-convnet 卷积神经网络 一般性结构卷积核个数 和 输入输出的关系以及输入输出的个数的说明:
卷积说明:输入是3个32*32, 共3*1024=3072。每条边padding为2,则内存里实际为3个36*36.卷积核个数是3维的5*5分别与3个输入进行卷积运算,得到3维的32*32的输出,这里将3维的32*32对应位相加得到一张32*32的feature Map如果有64个3维的5*5卷积核就有64张feature Map原创 2014-06-09 15:40:57 · 37788 阅读 · 4 评论 -
图像识别谈论,不仅限于OCR,基于水表识别,燃气表识别为例
图像识别谈论,不仅限于OCR,基于水表识别,燃气表识别为例图像识别谈论不仅限于OCR基于水表识别燃气表识别为例图像处理到底靠不靠谱做检测识别需不需要做图像预处理图像识别中最核心最难搞的模块之一目标检测定位分割图像识别实际应用中的逻辑问题修复我们都知道单纯靠算法解决一切问题是不现实,图像识别作为一个工程性很强的领域,更多的需要从输入源,也就是图像采集端(摄像头或者扫描仪等)、光源以及系统架构方原创 2016-04-16 01:23:32 · 22877 阅读 · 13 评论 -
字符识别OCR研究一(模板匹配&BP神经网络训练)
Abstract 2一 引言:... 3二 字符图像获取:... 3三 字符预处理... 43.2 字符区域………………………………………………………………………….43.2 字符区域分割:... 43.3 单个字体分割:... 43.4 单个字体裁剪原创 2011-09-23 11:02:19 · 52498 阅读 · 38 评论 -
名片、身份证、银行卡定位矫正算法:基于LSD直线检测,角点确定,透视变换
lsd直线提取程序说明 函数模型:ntuple_list lsd(image_double image); 直线提取程序是C语言,若使用C++,需要在头文件说明:extern "C"{#include "lsd.h"};该程序处理的数据类型是作者自己定义的image_double类型,所以无论编程者将图像存在何种格式下,必须进行类型转化。image_double类型定义如下:原创 2017-11-21 20:06:09 · 7270 阅读 · 4 评论