计算机视觉
文章平均质量分 76
飞锡2024
算法工程师,paddle/cv girl
展开
-
paddleocr icdar2015数据集训练dbnet检测模型
训练过程中,默认保存两种模型,一种是latest命名的最新训练的模型,一种是best_accuracy命名的精度最高的模型。下载地址:https://paddleocr.bj.bcebos.com/dataset/total_text.tar。下载地址:https://paddleocr.bj.bcebos.com/dataset/TD_TR.tar。数据集包含了多种复杂的文本样本,包括多行文本、曲线文本、不同字体和大小的文本。数据集涵盖了多种文本样本,包括复杂的背景、多行文本、不同字体和大小的文本。原创 2024-07-18 15:36:00 · 409 阅读 · 0 评论 -
Paddle OCR v4 微调训练文字识别SVTRNet模型实践
paddle ocr v4 微调训练文字识别模型实践原创 2024-04-25 18:25:06 · 2179 阅读 · 0 评论 -
mmocr安装和使用
MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。它是 OpenMMLab 项目的一部分。原创 2024-03-26 21:05:57 · 514 阅读 · 0 评论 -
DB算法原理与构建
DB的Backbone用于提取图像的多尺度特征,如下代码所示,假设输入的形状为[640, 640],backbone网络的输出有四个特征,其形状分别是 [1, 16, 160, 160],[1, 24, 80, 80], [1, 56, 40, 40],[1, 480, 20, 20]。输入的图像经过网络Backbone和FPN提取特征,提取后的特征级联在一起,得到原图四分之一大小的特征,然后利用卷积层分别得到文本区域预测概率图和阈值图,进而通过DB的后处理得到文本包围曲线。,更好的分离文本背景与前景。原创 2024-03-14 17:39:46 · 1619 阅读 · 0 评论 -
深度学习 tablenet表格识别实践记录
它是一个端到端模型,将文档分辨率为 1024x1024 的图像作为输入,并生成两个语义标记的输出,一个用于图像中的表,另一个用于表中的列,分别称为表和列掩码。生成这些掩码后,使用表掩码从图像中过滤表格。值得一提的是,ResNet-18 和 EfficientNet 的性能几乎接近 DenseNet,但选择了基于测试数据的最佳 F1 分数的模型。类似于编码器-解码器模型,编码器对图像中表的位置和结构信息进行编码,解码器使用这些信息为表和列生成掩码。检测到的表的行和列中检测和提取信息,称为表结构识别。原创 2024-03-20 14:09:35 · 837 阅读 · 0 评论 -
OCR介绍与实践 一
动手学OCR笔记-介绍与实践原创 2022-08-15 17:42:25 · 2273 阅读 · 0 评论 -
《计算机视觉中的深度学习》之目标检测算法原理
减少目标定位的准确度减少背景干扰提高目标定位的准确度目标检测系统常用评价指标:检测速度和精度提高精度:有效排除背景,光照和噪声的影响提高检测速度:精简检测流程,简化图像处理算法算法概述:传统目标算法、基于候选区域的两步算法、基于回归的单步算法1.传统目标算法对于区域选择,传统目标检测最常用的两种模型是滑动窗口模型与缩放窗口模型。滑动窗口模型,顾名思义,是通过设计好的窗口在图像上进行滑动来检测目标。基于滑动窗的检测算法的主要实现方法有两种,分别为缩放检测图像法和缩放窗口法。原创 2024-03-16 09:38:11 · 1099 阅读 · 0 评论 -
语义分割semantic segmention 与 FCN
我们通过继承高级API提供的Dataset类,自定义了一个语义分割数据集类VOCSegDataset。通过实现__getitem__函数,我们可以任意访问数据集中索引为idx的输入图像及其每个像素的类别索引。由于数据集中有些图像的尺寸可能小于随机裁剪所指定的输出尺寸,这些样本可以通过自定义的filter函数移除掉。此外,我们还定义了normalize_image函数,从而对输入图像的RGB三个通道的值分别做标准化。normalize均值为0方差为1#@save。原创 2024-03-15 19:23:18 · 801 阅读 · 0 评论 -
目标检测C-RNN,Fast C-RNN,Faster C-RNN,SSD,Mask R-CNN 理论简单介绍
参考:https://zh-v2.d2l.ai/chapter_computer-vision/multiscale-object-detection.htmlR-CNN 及系列区域卷积神经网络 region-based CNNR-CNNR-CNN首先从输入图像中选取若干(例如2000个)提议区域,并标注它们的类别和边界框(如偏移量)。用卷积神经网络对每个提议区域进行前向传播以抽取其特征。 接下来,我们用每个提议区域的特征来预测类别和边界框。R-CNN步骤:对每张图选择多个区域,然后每个区原创 2024-03-13 21:13:20 · 977 阅读 · 0 评论 -
opencv通过轮廓去除虚线
将虚线膨胀为实线,通过高度和宽度找到轮廓,再将轮廓内的面积涂白色。原创 2023-06-26 10:02:18 · 840 阅读 · 0 评论 -
opencv官网 Blob检测
将blobColor设为0以选择较暗的Blob,设为255则选择较亮的Blob。基于大小:你可以通过设定参数filterByArea为1,并设置合适的minArea和maxArea值,从而根据Blob的大小进行过滤。用于检测图像中的斑点或目标区域的方法,它可以识别具有特定属性(如颜色、大小、形状等)的连通区域。Blob 是图像中一组连接的像素,它们共享一些共同属性(例如,灰度值)。在上图中,深色连接区域是 Blob,Blob 检测旨在识别和标记这些区域。圆度: 这个参数衡量的是Blob接近圆形的程度。原创 2024-03-05 16:44:13 · 787 阅读 · 0 评论 -
opencv官网教程: 轮廓检测详解
阈值化把图像中目标的边界转化为白色,所有边界像素有同样灰度值(“same intensity”),算法就可以从这些边界白色像素,检测到目标物体的边界(黑色像素作为背景会被忽略)顶层轮廓表示对象的外部边界,而内部轮廓表示对象内部的孔洞边界。RETR_TREE:提取所有轮廓并重建轮廓的整个层级结构,每个轮廓包含子类信息。轮廓:链接物体边界的所有点,通常,轮廓指的是有相同颜色和密度的边界像素。RETR_LIST :提取所有的轮廓,但不建立轮廓的整体层级关系。轮廓算法的准确率和质量高度取决于二进制图像的质量。原创 2023-10-29 11:19:41 · 842 阅读 · 0 评论 -
opencv顺时针旋转图片 cv2.getRotationMatrix2D
旋转图片两种方法原创 2023-08-29 14:37:43 · 1371 阅读 · 0 评论 -
opencv 提取表格
opencv提取表格原创 2023-02-25 15:02:47 · 843 阅读 · 0 评论 -
opencv+paddle orc 识别图片提取表格信息
opencv+paddle orc 识别图片提取表格原创 2022-07-23 18:39:00 · 4657 阅读 · 23 评论 -
windows上pycharm远程调试GPU服务器报错 Cannot load cudnn shared library报错解决
windows上pycharm远程调试GPU服务器报错 Cannot load cudnn shared library原创 2022-12-12 15:10:45 · 617 阅读 · 0 评论 -
opencv lsd算法检测直线并计算直线偏移角度
opencv lsd算法检测直线并计算直线偏移角度原创 2022-12-05 11:58:14 · 859 阅读 · 0 评论 -
HSV过滤灰色水印
HSV过滤灰色水印原创 2022-11-04 11:59:10 · 598 阅读 · 0 评论 -
opencv 常用函数
opencv 常用函数原创 2022-09-12 11:56:07 · 135 阅读 · 0 评论 -
opencv基础一(python)
一.图像基本操作1.引包:import cv2 #openvc读取图像格式BGRimport matplotlib.pyplot as pltimport numpy as np%matplotlib inline2.读取图片img = cv2.imread('s.jpg')#读取图片为灰度图img = cv2.imread('s.jpg',cv2.IMREAD_GRAYSCALE)3.展示图片#图像的显示,也可以创建多个窗口cv2.imshow('image',img)#等待原创 2020-08-01 13:05:51 · 482 阅读 · 0 评论 -
opencv实战练习二(python)
harris角点检测沿着x,y图像灰度变化迅速1.计算梯度大小2.合成矩阵,求特征值3.比较特征值大小接口cv2.cornerHarris()SIFT图像尺度空间得到特征点计算特征原创 2020-08-06 10:11:34 · 363 阅读 · 0 评论 -
卷积 、 图像去噪、边缘提取
卷积 、 图像去噪、边缘提取原创 2022-08-10 20:17:43 · 3348 阅读 · 0 评论