图像识别
文章平均质量分 85
基于python的图像识别
小小晓晓阳
自律及自由
展开
-
OCR原理解析
OCR (Optical Character Recognition,光学字符识别)技术是一种将印刷体或手写文字转化为可编辑文本的技术。即将图像中的文字进行识别,并以文本的形式返回。原创 2023-12-01 16:08:30 · 3049 阅读 · 0 评论 -
paddle ocr开启mkldnn加速后图片识别精度下降
使用ocr_system调用微调模型时发现部分图片在设置enable_mkldnn=True后出现识别精度下降问题原创 2023-11-23 15:29:08 · 520 阅读 · 0 评论 -
6款开源中文OCR使用介绍(亲测效果)
光学字符识别(Optical Character Recognition, OCR)是指对文本材料的图像文件进行分析识别处理,以获取文字和版本信息的过程。也就是说将图象中的文字进行识别,并返回文本形式的内容。ocr主要流程:随着ocr技术的日渐成熟,目前github中有很多开源项目可供选择,下面将介绍几种常用的开源ocr项目。飞桨首次开源文字识别模型套件PaddleOCR,目标是打造丰富、领先、实用的文本识别模型/工具库。最新开源的超轻量PP-OCRv3模型大小仅为16.2M。同时支持中英文识别;原创 2023-07-14 11:50:13 · 35382 阅读 · 7 评论 -
CnOCR 使用教程
CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。原创 2023-07-12 17:47:54 · 11504 阅读 · 4 评论 -
chinese_lite OCR使用教程
超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M。原创 2023-07-12 15:03:45 · 3006 阅读 · 0 评论 -
Paddle OCR 安装使用教程
PaddleOCR是飞浆开源文字识别模型,最新开源的超轻量PP-OCRv3模型大小仅为16.2M。同时支持中英文识别;支持倾斜、竖排等多种方向文字识别;支持GPU、CPU预测,并且支持使用paddle开源组件训练自己的超轻量模型,对于垂直领域的需求有很大帮助。原创 2023-07-06 10:07:28 · 12931 阅读 · 5 评论 -
Python - OpenCV简介
1. OpenCV简介 Opencv(Open Source Computer Vision Library)是一个基于开源发行的跨平台计算机视觉库,它实现了图像处理和计算机视觉方面的很多通用算法,已成为计算机视觉领域最有力的研究工具。在这里我们要区分两个概念:图像处理和计算机视觉的区别:图像处理侧重于“处理”图像–如增强,还原,去噪,分割等等;而计算机视觉重点在于使用计算机来模拟人的视觉,因此模拟才是计算机视觉领域的最终目标。 OpenCV用C++语言编写,它具有C ++,Python,Java和原创 2020-12-22 09:47:43 · 17485 阅读 · 1 评论 -
Python - OpenCV 图像二值化处理
图像二值化处理时图像处理过程中非常常见的一种操作,在python中比较常用的主要是opencv,pil两个第三库,对比来看的话,opencv使用要更加的方便灵活,文本主要介绍以下基于opencv的图像二值化处理方法。首相我们来看一种比较简单的图像二值化处理方法。全局阈值二值化主要思路就是设置一个阈值,低于该阈值的像素置为0(黑色),高于该阈值的像素置为255(白色),下面来看代码def image_binarization(img): # 将图片转为灰度图 .原创 2020-11-21 16:35:46 · 30059 阅读 · 3 评论 -
Python - OpenCV 图像灰度识别
本片文章将介绍一下基于opencv的图像灰度识别,主要介绍三通道的彩色图片的灰度识别,单通道图片无需判断。 对图片进行灰度识别我们要先明白一个基础知识,理论上讲,一张真正的灰度图应该是单通道或者RGB三通道值相等的,因此我们可以根据通道数或者像素RGB三通道值差异来判断。 接下来我们来介绍两种计算灰度值的方法。方法一def calculate_gray_value(img): # 分割RGB通道 r, g, b = cv2.split(img) ...原创 2020-11-08 11:37:43 · 4852 阅读 · 2 评论 -
Python - OpenCV加载图片
近期在python中使用opencv加载图片的时候遇到一些问题,在此记录一下。首先我们来看最常用的一种加载方式,通过imread()方法来加载。import cv2image = cv2.imread(img_path)img_path可以是绝对路径也可以时相对路径,但是这里存在一个问题,img_path路径中不能包含中文,即使使用的是相对路径,根目录到当前文件也不能存在中文路径否则会报错。接下来我们看两种其他的opencv加载图片的方法直接从文件中加载图片,可以解决中文路径问题im原创 2020-11-08 09:48:38 · 907 阅读 · 0 评论