图像识别
文章平均质量分 96
伙伴几时见
致力于成为一名数据科学家
展开
-
OpenCV入门笔记(七) 文字区域的提取
前面我们已经学了一些OpenCV中基本的图片处理的知识,可以拿来做一些小应用。比如怎样从一张图片中,把文字圈出来。这一步骤对OCR(Optical Character Recognition)非常有用,因为一般的OCR引擎只是拿来识别文字,并没有对图片做预处理,因此精度可能会收到图片质量影响。当然,我们这里只是粗略的查找文字区域,并没有进一步地处理图片。而且对背景复杂,或者文字旋转角度转载 2017-03-19 16:18:45 · 38216 阅读 · 4 评论 -
gamma 校正理解及python实现
注:思路是参考:http://blog.csdn.net/lichengyu/article/details/8457425点击打开链接python代码为原创1.什么是Gamma校正?Gamma源于早期的CRT显示器的响应曲线,也就是输出亮度和输入电压的非线性关系,如图所示:图1 亮度和输入电压的非线性关系图 由图可以看出,亮度和输入电压的关原创 2017-06-13 16:01:35 · 8561 阅读 · 3 评论 -
如何应用Python处理医学影像学中的DICOM信息
DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。它定义了质量能满足临床需要的可用于数据交换的医学图像格式,可用于处理、存储、打印和传输医学影像信息。DICOM可以便捷地交换于两个满足DICOM格式协议的工作站之间。目前该协议标准不仅广泛应用于大型医院,而且已成为小型转载 2017-06-13 16:27:22 · 2571 阅读 · 0 评论 -
OpenCV之Python学习笔记
感谢http://www.mamicode.com/info-detail-966896.html 这个链接的博主收集如此多的关于opencv-python 图像处理的常用知识。直都在用Python+OpenCV做一些算法的原型。本来想留下发布一些文章的,可是整理一下就有点无奈了,都是写零散不成系统的小片段。现在看 到一本国外的新书《OpenCV Computer Vision转载 2017-06-13 16:41:19 · 3671 阅读 · 0 评论 -
如何训练Tesseract 4.0
原文:https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00tesseract 4.0之后开始使用机器学习来进行字符识别,其训练模型的方法与以前的版本有所不同,现将其官网的手册翻译如下(未完成)一、引言Tesseract 4.0中包含了一个新的基于神经元网络的识别引转载 2017-07-27 17:38:26 · 21464 阅读 · 7 评论 -
图像的归一化
图像的归一化在计算机视觉当中,很多时候都作为一个预处理进行处理的。因为图像的归一化保持了仿射不变性。而且图像的归一化有时候能够提高计算的精度。所以图像的归一化对于我们来说很重要。而图像的归一化的具体过程主要是: 1.坐标中心化 2.x-shearing 归一化、3.缩放归一化4.旋转归一化而在上述当中的四步骤其实就是针对仿射转载 2017-08-14 15:05:41 · 970 阅读 · 0 评论 -
Crnn中文end-to-end识别
中文识别利用crnn训练英文的网络来训练中文,字符个数5529左右,中文的顺序按照tesseract开源项目复制过来的。github: https://github.com/bear63/sceneReco model: https://pan.baidu.com/s/1i5OLwt3 crnn文字识别模型 https://pan.baidu.com/s/1i4Hd9zv转载 2017-09-26 16:05:32 · 4899 阅读 · 3 评论 -
Tesseract 源码分析
之前的OCRus开发工作告一段落,后端OCR识别利用开源OCR引擎Tesseract。对于论文类型的文档,字体标准,大小一致,识别率很高,根据UNLV的测试结果,Tesseract的准确率都在90%以上,但对OCRus面向的手机照片,识别准确率并不高,对一些图片基本不可用。虽然OCRus做了一些图片预处理的工作,希望在将图片送入Tesseract之前能够使图片更清晰,更利于识别,但对识别结果不好的转载 2017-09-26 16:07:12 · 774 阅读 · 0 评论 -
http://blog.sina.com.cn/s/blog_59fabe030102v81s.html
http://blog.sina.com.cn/s/blog_59fabe030102v81s.html转载 2017-09-11 22:33:41 · 501 阅读 · 0 评论 -
YunOS场景文字识别
摘要: 该文章先介绍常见的文字识别方法,然后介绍YunOS在场景文字识别方面取得的进展、结果和技术方案。将重点讲解技术方案的两个主要部分:1)基于全卷积网络的从局部到整体的文字行检测方法;2)基于BLSTM-CTC-Seq2Seq的文字行识别方案。1 概述 随着深度学习技术的发展,尤其是卷积神经网络(Convolutional Neural Networks,CNN转载 2017-11-08 17:28:22 · 4778 阅读 · 0 评论 -
白翔:趣谈“捕文捉字”-- 场景文字检测 | VALSE2017之十
编者按:文字,区别于变幻莫测的图像和视频,有着更强的逻辑性和更概括的表达力。随着互联网和移动互联网技术的高速发展,越来越多的新型应用场景需要利用图像中的文字信息。从海量视频中快速检索感兴趣的文字,可以极大提高人类的认知效率。因此,自然场景中的文字提取技术,即从照片或视频中将文字识别出来,成为了近几年计算机视觉领域的热门研究课题。在本文中,来自华中科技大学的白翔教授,将为大家讲述多方向场景文字检测的转载 2017-11-03 10:32:20 · 5677 阅读 · 0 评论 -
文字的检测与识别资源
持续更新中.......【综述( Survey)】[2016-TIP] Text Detection Tracking and Recognition in Video:A Comprehensive Survey [paper][2015-PAMI] Text Detection and Recognition in Imagery: A Survey [paper]转载 2017-11-03 11:27:50 · 795 阅读 · 0 评论 -
Python读取图片EXIF信息类库介绍和使用实例
这篇文章主要介绍了Python读取图片EXIF信息类库介绍和使用实例,例如Python Imaging Library、EXIF.py等,需要的朋友可以参考下首先要介绍的是 Python Imaging Library,使用方法如下:复制代码代码如下:from PIL import Imagefrom PIL.ExifTags import TAGS转载 2017-11-15 10:12:28 · 11546 阅读 · 0 评论 -
ocr比较好的资料链接-需要的记得广播
tesseract-ocr广为传播的,必需置顶,但是对中文的处理不是很好,如果是自然场景,基本就呵呵了,参考链接: https://github.com/tesseract-ocr 这是北京的一位AI大牛个人的试验程序,中文效果不错,本人也有参与,大家可以试下在这基础上结合自己的应用场景,进行拓展,参考链接:https://github.com/senlinuc/caffe_o原创 2017-11-24 17:17:06 · 496 阅读 · 0 评论 -
限制对比度自适应直方图均衡化算法原理、实现及效果
一、自适应直方图均衡化(Adaptive histgram equalization/AHE) 1.简述 自适应直方图均衡化(AHE)用来提升图像的对比度的一种计算机图像处理技术。和普通的直方图均衡算法不同,AHE算法通过计算图像的局部直方图,然后重新分布亮度来来改变图像对比度。因此,该算法更适合于改进图像的局部对比度以及获得更多的图像细节。转载 2017-06-22 14:43:17 · 1298 阅读 · 0 评论 -
图像归一化作用和方法
不管是Python || C++ ||Matlab,咱们关注的是归一化处理的思路,以及为什么要进行归一化,不要被语言所局限matlab图像处理为什么要归一化和如何归一化,一、为什么归一化1. 基本上归一化思想是利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响。也就是转换成唯一的标准形式以抵抗仿射变换 图像归一化使得图像可以抵抗几何变换的攻击,它转载 2017-06-20 11:26:10 · 5061 阅读 · 0 评论 -
采用opencv_cascadetrain进行训练的步骤及注意事项
OpenCV中有两个程序可以训练级联分类器: opencv_haartraining 和opencv_traincascade。opencv_traincascade 是一个新程序,使用OpenCV 2.x API 以C++ 编写。这二者主要的区别是 opencv_traincascade 支持 Haar、Hog和 LBP(Local Binary Patterns) 三种特征,并易于增加其他转载 2017-06-01 15:07:42 · 494 阅读 · 0 评论 -
使用Python和OpenCV检测图像中的物体并将物体裁剪下来
介绍硕士阶段的毕设是关于昆虫图像分类的,代码写到一半,上周五导师又给我新的昆虫图片数据集了,新图片中很多图片很大,但是图片中的昆虫却很小,所以我就想着先处理一下图片,把图片中的昆虫裁剪下来,这样除去大部分无关背景,应该可以提高识别率。 原图片举例(将红色矩形框部分裁剪出来)): step1:加载图片,转成灰度图image = cv2.imread("353.jpg")gray转载 2017-03-19 16:19:44 · 9949 阅读 · 5 评论 -
python windows安装使用tesseract中的问题解决(WindowsError: [Error 2])
安装参考地址:http://blog.csdn.net/evankaka/article/details/49533493问题一、WindowsError: [Error 2] 问题详细提示,如下:产生原因: 调用tesseract.exe失败解决:把tesseract.exe加入当前工程,如图:说明:这个tesseract.exe就相当于在Linu转载 2017-03-15 10:38:53 · 1015 阅读 · 2 评论 -
OpenCV-Python 图像与视频处理
https://segmentfault.com/a/1190000003742481未完,待续,先mark一下。转载 2017-03-15 23:12:36 · 770 阅读 · 0 评论 -
wxPython利用pytesser模块实现图片文字识别
Pytesser——OCR in Python using the Tesseract engine from Googlepytesser是谷歌OCR开源项目的一个模块,在python中导入这个模块即可将图片中的文字转换成文本。链接:https://code.google.com/p/pytesser/pytesser 调用了 tesseract。在python中调用py转载 2017-03-16 15:47:26 · 547 阅读 · 0 评论 -
OpenCV Python教程(2、图像元素的访问、通道分离与合并)
OpenCV Python教程之图像元素的访问、通道分离与合并转载请详细注明原作者及出处,谢谢!访问像素像素的访问和访问numpy中ndarray的方法完全一样,灰度图为:[python] view plain copyimg[j,i] = 255 其中j,i分别表示图像的行和列。对于BGR图像,为:转载 2017-03-16 17:33:31 · 510 阅读 · 0 评论 -
Tesseract-OCR 字符识别---样本训练
Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。 Tesseract最初由HP公司开发,后来由Google维护,目前发布在Googel Project上。地址为http://code.google.com/p/tesseract-ocr/。转载 2017-04-09 23:06:32 · 588 阅读 · 0 评论 -
利用opencv库识别身份证图片
一、前言本文主要实现了对身份证图片上身份证号码的自动识别,在Qt平台上使用opencv进行图像处理,并绘制简单的用户界面,设计了一个基于Qt和opencv的身份证号码识别系统。二、用户界面 用户界面如下所示,简单几个控件,这里只是实现了身份证号码的识别,而没有对汉字(姓名及地址)识别,水平尚且不足。三、身份证图像处理流程下图为身份转载 2017-05-24 17:06:00 · 15120 阅读 · 4 评论 -
mark
https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/detect_er_chars.py翻译 2017-04-24 21:56:28 · 354 阅读 · 0 评论 -
在Windows下编译扩展OpenCV 3.1.0 + opencv_contrib
为什么要CMake,这里我陈述自己的想法,作为一个刚使用opencv库的小白来说,有以下大概三点内容1.由于在学习图像处理滤波器中,需要用到各种边缘保护滤波器(EPS)算法,但是这些算法在OpenCV 3.1.0的Release版本中存在很少,因为他们把大量的算法存放在opencv_contrib目录下面的未稳定功能模块里的ximgproc文件夹下,所以如果我们想要使用这个目录的功能,就需要自转载 2017-04-26 10:46:50 · 528 阅读 · 0 评论 -
[wiki]windows下重新编译OpenCV 及其附加库 opencv_contrib, 生成Python接口
OpenCV 3 之后改变了框架,采用了主体+插件的方式,插件里是一些新功能,有些还不稳定,官方在不断地更新。项目想用Python调用opencv,低版本的opencv里的跟踪算法不够先进,OpenCV 3.1官方release的python接口(pyd文件)不含SURF,SIFT,Tracking等模块,要想使用OpenCV中的这些方法,就需要重新编译OpenCV及其附加插件库:opencv转载 2017-04-26 14:19:12 · 667 阅读 · 0 评论 -
如何使用OpenCV的处理图像,文字变得锐利和清晰?(How to use OpenCV to process image so that the text become sharp and clea
问 题Wanted to achieve something like this: http://www.leptonica.com/binarization.htmlWhile searching for solutions, most of the answers were general instructions such as advise to look转载 2017-06-05 16:28:28 · 12755 阅读 · 0 评论 -
使用opencv的SVM实现车牌区域识别
一、前言本文仅仅演示使用opencv2.4.6中已经定义好的SVM函数实现对车牌区域正负样本的训练,然后使用训练好的SVM模型对测试样本进行预测。二、所使用的正负样本首先我将一系列图片进行图像预处理、分割等一系列步骤,这部分内容可以参看《深入理解opencv 使用计算机视觉项目解析》,这样从中挑选出100个正样本(车牌区域)和70个负样本(非车牌区域),大小均为14转载 2017-06-05 18:06:59 · 1026 阅读 · 1 评论 -
Caffe学习-手写数字识别
1. Caffe训练方法综述caffe非常简单,训练时只需写prototxt文件即可,其大致的步骤为:Resize图片,转换存储格式(LMDB/LevelDB)定义网络结构(编辑prototxt)定义solver(编辑另一个prototxt)一行命令开始训练(可以基于已有的权重赋值)如下图所示,其训练的过程,关于卷积神经网络(CNN)可以参考:计算机视觉与卷积神经网络下面对手写数字识别进行训练。2...转载 2018-03-10 16:54:52 · 287 阅读 · 0 评论