计算机视觉
文章平均质量分 57
shelleyHLX
这个作者很懒,什么都没留下…
展开
-
ICPR MTWI 2018挑战赛 网络图像的文本识别之数据预处理
该数据预处理工作主要是基于图片数据集&坐标文本信息数据集来对图片进行切割和文本信息的匹配。实现过程中参考的博客:opencv图片旋转矩形分割https://blog.csdn.net/u013948010/article/details/78605043基于anaconda的编辑器spyder,python3.6,图像处理的库使用了Opencv,由于anaconda自带有的集成环境以及Anaconda Navigator可以让总是被折磨于环境和库的配置的菜鸟得以苟活。综上所述...转载 2020-12-28 13:52:46 · 1476 阅读 · 0 评论 -
Python图像处理 PIL中convert(‘L‘)函数原理
1.img = img.convert() PIL有九种不同模式:1,L,P,RGB,RGBA,CMYK,YCbCr,I,F。1.1 img.convert('1') 为二值图像,非黑即白。每个像素用8个bit表示,0表示黑,255表示白。1.1.1 Code1 from PIL import Image2 3 4 def convert_1():5 image = Image.open("D:/pytorch_code/pytorch_study/fusi..转载 2020-12-23 10:55:56 · 9605 阅读 · 0 评论 -
图片标记工具的使用labelme, labelimage的使用
文章目录LabelmelabelimageLabelme标记非水平多边形首先安装anacondawindows下创建新环境,python版本为2.7C:\Windows\system32>conda create --name labelme python=2.7labelme:名字python=2.7激活环境C:\Windows\system32>activate labelmeconda install pyqtpip install labelme会安装相应的依赖原创 2020-12-04 11:13:11 · 1009 阅读 · 0 评论 -
快速训练残差网络 ResNet-101,完成图像分类与预测,精度高达 98% | 迁移学习实战...
作者 |AI 菌出品 | CSDN博客题图 | 视觉中国笔者在实现ResNet的过程中,由于电脑性能原因,不得不选择层数较少的ResNet-18进行训练。但是很快发现,虽然只有18层,传统的训练方法仍然很耗时,甚至难以完成对101层的ResNet-101的训练。 出于这个原因,这一次,我将采用一种巧妙的方法——迁移学习来实现。即在预训练模型的基础上,采用101层的深度残差网络ResNet-101,对如下图所示的花数据集进行训练,快速实现了对原始图像的分类和预测,最终预测...转载 2020-12-03 11:30:40 · 3233 阅读 · 4 评论 -
【kimol君的无聊小发明】—用python识别滑块中的缺口
https://blog.csdn.net/kimol_justdo/article/details/109634133原创 2020-11-12 17:13:24 · 97 阅读 · 0 评论 -
Fashion-MNIST下载地址
Fashion-MNIST训练集的图像:60000,http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz训练集的类别标签:60000,http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz测试集的图像:10000,http://fashion-mnist.s3-we转载 2020-08-19 17:33:42 · 560 阅读 · 0 评论 -
python中不同库读取图片的格式不同
文章目录1. 图片的长度和宽度的获取方式不同2. 图片的类型不同1. 图片的长度和宽度的获取方式不同cv2: <class ‘numpy.ndarray’>PIL.Image:<class ‘PIL.JpegImagePlugin.JpegImageFile’>skimage.io:<class ‘numpy.ndarray’># coding: utf-8from PIL import Imageimport cv2from skim原创 2020-06-12 13:50:36 · 420 阅读 · 0 评论 -
FOTS测试时出现的错误
FOTS测试时出现的错误:adaptor.cpp:53:1: note: in expansion of macro ‘PYBIND11_PLUGIN’ PYBIND11_PLUGIN(adaptor)一般来说是编译环境版本不对应的问题。于是修改pse/include/pybind11/detail/common.h中的第112~114:#include <Python....原创 2020-04-28 10:52:47 · 504 阅读 · 0 评论 -
shapely包的使用
1. Point,LineStrings共有的变量和方法PointLineStrings引入包from shapely.geometry import Pointfrom shapely.geometry import LineString共有的变量和方法object.area Returns the area (float) of the object.object...原创 2020-04-27 14:34:14 · 1240 阅读 · 0 评论 -
IOU的计算
1. 定义IOU(Intersection over Union)即交并比,是目标检测中衡量目标检测算法准确度的一个重要指标,顾名思义,即交集与并集的比值。数据的标签通常是目标框的信息,如:x,y,w,h。ground truth 所在的框是一个目标真实label,而bounding box 就是目标检测算法预测的目标的label。如果两个框能完全重合,那么就说明目标检测算法预测结果完全正确...原创 2020-04-27 14:12:02 · 5774 阅读 · 0 评论 -
从显示图像上实时获取像素值,确定窗口大小
在ubuntu 中,用python实现显示图像,以及根据鼠标的位置获得rgb,hsv等的值。# coding: utf-8# @Time :20-3-18 下午3:38# @Author :LUAN XIN HUANG# @Modifer :# @FileName :show_img_get_mouse_value.pyimport cv2img = cv2...原创 2020-03-18 16:09:16 · 722 阅读 · 0 评论 -
图像去噪,深度学习去噪,普通方法
1、BM3D 降噪2、DCT 降噪3、PCA 降噪4、K-SVD 降噪5、非局部均值降噪6、WNNM 降噪7、基于主成分分析和双边滤波的图像降噪算法8、小波变换9、小波阈值降噪10、Contourlet 变换①高斯滤波②中值滤波③P-M方程去噪④TV法去噪reproducible-image-denoising-state-of-the-artCol...原创 2020-03-10 15:59:39 · 7264 阅读 · 3 评论 -
Python实现图像平移、旋转、水平镜像等
一、图像平移二、图像水平镜像三、图像垂直镜像四、图像缩放五、图像旋转Python代码实现:import cv2import mathimport numpy as npclass Img: def __init__(self,image,rows,cols,center=[0,0]): self.src=image #原始图像 ...转载 2019-12-27 15:13:08 · 3228 阅读 · 0 评论 -
计算机视觉、模式识别、人工智能
一、计算机视觉Divid Marr将计算机视觉系统的开发问题归纳为3个要素:(1)数学理论考虑数学计算层面的目标及可以引入的合理约束条件。(2)描述和算法重点解决计算机视觉中的输入输出的数据格式问题,并设计合理的算法实现其系统功能。(3)硬件的合理使用使用符合算法要求的硬件并考虑该硬件对所需要的算法和描述的反作用。计算机视觉系统框架1.1 图像数据处理层...转载 2019-12-24 10:08:36 · 596 阅读 · 0 评论 -
深度学习简介
文章目录1 深度学习概述什么是深度学习?深度学习和人工智能的关系?深度学习 vs. 传统机器学习深度学习的优势深度学习的劣势深度学习需要哪些条件?深度学习的应用场景?2 深度学习基本原理深度学习具体怎么做?深度学习的前身:多层感知机(人工神经网络)解决方式:卷积神经网络(CNN)局部感受野(local receptive fields)权值共享(shared weights)池化(pooling)...原创 2019-12-16 15:12:46 · 1352 阅读 · 0 评论 -
卷积神经网络参数
文章目录局部连接(Sparse Connectivity)权值共享(Shared Weights)分类器输入过多,过拟合 (over-fitting)Convolution层:Pooling层**卷积神经网络(Convolutional Neural Network, CNN)**是深度学习技术中极具代表的网络结构之一,在图像处理领域取得了很大的成功,在国际标准的ImageNet数据集上,许多成...转载 2019-12-16 10:38:13 · 840 阅读 · 0 评论 -
python-opencv 直线检测
文章目录1 原理2 使用HoughLines()检测直线1 原理众所周知, 一条直线在图像二维空间可由两个变量表示. 例如:在 笛卡尔坐标系: 可由参数: (m,b)(m,b)(m,b) 斜率和截距表示.在 极坐标系: 可由参数: (r,θ)(r,\theta)(r,θ) 极径和极角表示对于霍夫变换, 我们将用 极坐标系 来表示直线. 因此, 直线的表达式可为:y = \left (...原创 2019-12-10 14:21:07 · 7654 阅读 · 0 评论 -
python读取图片获得的不同的长和宽
from PIL import Imageimport cv2from skimage import iodef shape_size(): img = cv2.imread('img_part.jpg') print(img.shape) # h, w, c img1 = Image.open('img_part.jpg') print(img1...原创 2019-12-04 09:58:13 · 3338 阅读 · 0 评论 -
opencv python Ubuntu Windows 的whl包下载
https://pypi.org/project/opencv-python/#fileshttps://pypi.tuna.tsinghua.edu.cn/simple/opencv-python/https://pypi.org/project/opencv-python/3.4.2.16/#files原创 2019-12-03 14:53:28 · 1345 阅读 · 0 评论 -
OpenCV常用数据类型与C++原始类型对照
为什么会想到这个问题呢?因为如果不搞清楚实际的类型,在使用at<data_type>(i,j)函数时,会抛出异常。Mat_<uchar>---------CV_8UMat<char>-----------CV_8SNat_<short>---------CV_16SMat_<ushort>--------CV_16UMat...转载 2019-11-28 15:51:44 · 501 阅读 · 0 评论 -
ubuntu安装 opencv, C++语言进行测试
0、安装前准备:(1)安装编译工具sudo apt-get install build-essential -y(2)安装依赖包sudo apt-get install libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev -ysudo apt-get -y remove ffmpeg x2...原创 2019-11-28 15:06:02 · 992 阅读 · 0 评论 -
仿射变换(Affine Transformation)
文章目录仿射变换(Affine Transformation)仿射变换的类型仿射变换的公式和计算1 平移变换 Translation2 缩放变换(Scale)3 剪切变换(Shear)4 旋转变换(Rotation)5 组合变换模型是指根据待匹配图像与背景图像之间几何畸变的情况,所选择的能最佳拟合两幅图像之间变化的几何变换模型。可采用的变换模型有如下几种:刚性变换、仿射变换、透视变换和非线形变换...转载 2019-11-22 10:09:12 · 8508 阅读 · 0 评论 -
error in function 'threshold'
ret, thresh1 = cv2.threshold(img, 130, 255, cv2.THRESH_TRIANGLE)cv2.error: OpenCV(3.4.2) /io/opencv/modules/imgproc/src/thresh.cpp:1411: error: (-215:Assertion failed) src.type() == (((0) & ((1 &...原创 2019-11-20 10:48:57 · 581 阅读 · 0 评论 -
14. 最长公共前缀
编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串""。示例1:输入: ["flower","flow","flight"]输出: "fl"示例2:输入: ["dog","racecar","car"]输出: ""解释: 输入不存在公共前缀。说明:所有输入只包含小写字母a-z。# coding: utf-8clas...原创 2019-11-18 11:43:49 · 107 阅读 · 0 评论 -
从缩放后的图像的坐标获得原始图像对应的坐标
从缩放的图像获得缩放率,用缩放率对缩放后的坐标进行映射,获得原始图像对应的坐标。# coding: utf-8import cv2from PIL import Imageimport numpy as npdef resize_im(im, scale, max_scale=None): f = float(scale) / min(im.shape[0], im...原创 2019-11-18 10:36:11 · 4422 阅读 · 0 评论 -
Opencv之图像自适应阈值二值化处理adaptiveThreshold
一、自适应阈值相比于固定阈值的二值化处理【https://blog.csdn.net/qq_37385726/article/details/82015545】自适应阈值不需要确定一个固定的阈值,而是可以根据对应的自适应方法,通过图像的局部特征自适应的设定阈值,做出二值化处理。二、adaptiveThresholdadaptiveThreshold(img输入图像....原创 2019-11-13 17:34:13 · 685 阅读 · 0 评论 -
目标检测算法中检测框合并策略技术综述
https://blog.csdn.net/SIGAI_CSDN/article/details/83538558转载 2019-11-11 14:01:23 · 282 阅读 · 0 评论 -
TypeError: img is not a numpy array, neither a scalar
代码如下:# coding: utf-8import cv2import numpy as npfrom PIL import Imageif __name__ == '__main__': image = Image.open('1.jpg') cv2.imwrite('1_.jpg', image)出错:Error: img is not a num...原创 2019-11-05 09:25:30 · 14792 阅读 · 0 评论 -
python的opencv中cvtColor出错
Traceback (most recent call last): File "/home/hlx/anaconda3/doc/py_op/crnn_chinese_test/data/preprocess.py", line 10, in <module> gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)cv2.erro...原创 2019-11-04 09:03:38 · 2924 阅读 · 0 评论 -
如何生成大批量的可以训练的数据
深度学习中,让一个模型能够有更好的泛化能力,最重要的根本就是数据的多样性。但是现实中场景数据复杂多样。以OCR文档识别为例,一方面收集会耗费大量精力(文档图像拍照等等),另一方面,标注过程费时费力,不仅需要标注文本位置,还需要标注其对应的label信息。以下仅为思路参考:1、有可以大量使用的电子版数据(数据库、文本文档等)2、利用word模板生成对应的word文档3、docx...转载 2019-10-31 14:35:31 · 442 阅读 · 0 评论 -
OCR目前的发展现状综述
文章目录1 OCR的应用场景2 OCR目前的技术综述以及文献2.1 文本检测2.2 文本识别3 最新比赛进展本文目的是为了总结OCR各类技术的发展,从搜集资料到整理,可以看出OCR技术目前的一个大致发展趋势。目前还处于随时添加状态,敬请期待!【更新时间】2019年9月26日【很好的参考资料】这个GitHub收集了文本检测、文本识别、端到端的论文以及部分开源代码,很好的学习资料!1...转载 2019-10-31 14:32:15 · 2918 阅读 · 0 评论 -
YOLO9000: Better, Faster, Stronger
文章目录Abstract1. Introduction2. BetterAbstractWe introduce YOLO9000, a state-of-the-art, real-time object detection system that can detect over 9000 object categories. First we propose various improv...原创 2019-10-30 15:36:00 · 371 阅读 · 0 评论 -
YOLOv3: An Incremental Improvement
文章目录Abstract1. Introduction2. The Deal2.1. Bounding Box Prediction2.2. Class Prediction2.3. Predictions Across Scales2.4. Feature Extractor2.5. Training3. How We Do4. Things We Tried That Didn’t Work5...原创 2019-10-28 17:31:11 · 310 阅读 · 0 评论 -
You Only Look Once: Unified, Real-Time Object Detection
文章目录Abstract1. Introduction2. Unified Detection2.1. Network Design2.2. TrainingAbstractWe present YOLO, a new approach to object detection. Prior work on object detection repurposes classifiers to p...原创 2019-10-24 10:43:41 · 598 阅读 · 0 评论 -
目标检测--IOU,bounding box
文章目录1.IOU的意义2 边框回归是什么?2.1 边框回归怎么做的?2.1.1 Input:2.1.2 Output:2.2 为什么宽高尺度会设计这种形式?2.2.1 x,y 坐标除以宽高2.2.2 宽高坐标Log形式2.2.3 为什么IoU较大,认为是线性变换?other1.IOU的意义如图红色框和绿色框所示,红色框是Selective Search提取的的Region Prop...原创 2019-10-21 15:16:55 · 791 阅读 · 0 评论 -
Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks
文章目录Abstract1. Introduction2. Related Work2.1. Text Detection2.2. Text Recognition2.3. Text Spotting Systems3. Model3.1. Overall Architecture3.2. Text Proposal Network3.3. Region Feature Encoder3.4. T...原创 2019-10-12 17:36:02 · 1544 阅读 · 1 评论 -
超强合集:OCR 文本检测干货汇总(含论文、源码、demo 等资源)
本文篇幅较长,建议收藏阅读,全文目录如下:papersText DetectionText RecognitionText Detection+RecognitionBreaking CaptchaHandwritten RecognitionPlate RecognitionBlogsProjectsVideosResourcesPapersMu...转载 2019-10-12 11:55:18 · 3193 阅读 · 0 评论 -
awesome-semantic-segmentation 语义分割
Awesome Semantic SegmentationNetworks by architectureSemantic segmentationU-Net [https://arxiv.org/pdf/1505.04597.pdf] [2015] https://github.com/zhixuhao/unet [Keras] https://github.com/joci...转载 2019-01-21 10:19:44 · 1593 阅读 · 0 评论 -
awesome-computer-vision 计算机相关资源~-2016
Awesome Computer Vision: from: https://github.com/jbhuang0604/awesome-computer-vision#coursesA curated list of awesome computer vision resources, inspired by awesome-php.For a list people in com...转载 2019-01-21 09:50:46 · 851 阅读 · 1 评论 -
目标检测 object-detection
This is a list of awesome articles about object detection.from: 引自GitHubR-CNNFast R-CNNFaster R-CNNLight-Head R-CNNCascade R-CNNSPP-NetYOLOYOLOv2YOLOv3YOLTSSDDSSDFSSDESSDMDSSDPeleeFi...转载 2019-01-21 09:29:54 · 845 阅读 · 0 评论