计算机视觉
文章平均质量分 65
描述了OPENCV中处理图像的一些方法
Hogan180
这个作者很懒,什么都没留下…
展开
-
一起了解Transformer
前言Transformer是GooGle在2017年提出的,一开始主要应用于NLP领域,比如翻译,文本分类,比如BERT就有用到。随着技术不断发展,这门技术也逐渐应用于计算机视觉的领域了。可是,CNN卷积神经网络不是一直主流技术吗?什么时候transformer也来凑热闹了?CNN的局限性我们平常在计算机视觉中所提及的卷积神经网络,大部分是指2维卷积,其实在NLP处理中也会用到1维卷积,用来提取信息。此时,就是以时间序列地形式来表示了。卷积神经网络仅关注局部的信息,而忽略了全局的感知和理解,在信原创 2021-01-23 10:44:12 · 1596 阅读 · 1 评论 -
浅尝YOLOv4论文
摘要对于目标检测来说,都有one-stage和two-stage的方法,而yolo系列的算法都是one-stage的。one-stage速度快但是精确度却会稍微低一些。而yolov4就做到了鱼与熊掌都可兼得的效果,并且还可以降低硬件的要求。yolov4的主要贡献:1.设计了一个高精度、高实时性的网络,并且该网络只需要一个GPU就可以快速训练;2. 验证了Bag-of-Freebies和Bag-of-Specials对目标检测的影响很大,并将之使用到yolov4的网络中;yolov4的网络结构原创 2020-10-21 18:01:46 · 2077 阅读 · 0 评论 -
场景文本检测的方法(CTPN+EAST+DBNet)
前言文字识别分为两个具体步骤:一个是文字区域的检测,二是对文字内容进行识别。两者缺一不可,尤其是文字检测部分,是识别的前提。如果连包含文字的区域都找不到,那后面也就无法进行文字识别了。因为文本存在多种分布,多种方向、排版多样性的特点,所以检测不是一件简单的任务,尤其是当文本是不规则的形状,检测起来就很具有挑战性了。1.传统的图像学处理:基本思想就是 : 得出文本信息所在位置的轮廓,中间还可能进行一些形态学的操作:先二值化图片可以自适应二值化如果有些噪声可以采用高斯滤波来简单过滤掉然后通过腐蚀原创 2020-10-21 18:00:50 · 6634 阅读 · 0 评论 -
OCR所涉及的技术
OCR所涉及的技术OCR也叫作光学字符识别,主要用到了CNN来提取特征以及RNN来对序列进行分析相关性,这两者后来就结合而成了CRNN。然后还用CTC(Connectionist temporal classification)作为损失函数来解决对齐问题。CNN简介卷积神经网络里有一个概念叫做感受野。感受野是用来表示网络内部不同神经元对图像的感受范围,也就是在CNN中表示原图的区域大小,那是因为CNN关注局部像素的相关性比较强,而较远像素的相关性则比较弱,所以神经元的感受野越大,说明它能感受到全图原创 2020-10-21 18:00:24 · 2010 阅读 · 1 评论 -
你说的那个卷积神经网络,是个什么?
前言无论是机器学习还是深度学习,都是为了解决某个问题,比如为了解决分类的问题。拿猫狗分类当作例子,那么就需要知道猫,狗究竟是怎么表达的,要去了解它们的毛发,体型,长相等等。以上说的就是我们到底要选取它们的哪一些特征。当我们选取了合适的特征之后,就可以让机器学习,深度学习这一些算法去帮我们逐步去训练,去学习它们的特征。以深度学习为例:训练完毕后,我们就可以得到在神经网络中各个层的参数。卷积神经网络的组成卷积神经网络概括:卷积的主要作用是提取特征,并且在提取特征的同时能够使网络加深。因为卷积的过程原创 2020-10-21 18:00:10 · 687 阅读 · 0 评论 -
浅尝YOLOv3论文
关于YOLOYOLO的意思是 you only look once,比起想RCNN,FAST RCNN这些two stage的方法,YOLO仅仅需要扫描一遍图像,而不需要另外再寻找ROI,感兴趣的区域。YOLOv3是2018年发明的算法,并且所发表的论文也较为简短。以下是YOLOv3的网络结构图:上图三个蓝色方框内表示Yolov3的三个基本组件:(1)CBL:Yolov3网络结构中的最小组件,由Conv+Bn+Leaky_relu激活函数三者组成。(2)Res unit:借鉴Resnet网络中的残原创 2020-10-21 17:59:23 · 869 阅读 · 0 评论 -
RCNN家族的详解(RCNN,FAST RCNN, FASTER RCNN)
目标检测在目标检测中,一类是基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它们是two-stage的,需要先使用启发式方法(selective search)或者CNN网络(RPN)产生Region Proposal,然后再在Region Proposal上做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个CNN网络直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速原创 2020-10-21 17:59:01 · 931 阅读 · 1 评论 -
数据增强---对比度处理
对比度处理:更改对比度是数据增强的一种极好方式,在训练前的图片预处理也是经常使用到的。在OpenCv中,可以通过addWeighted来修改图片的对比度。在这个方法中,我们可以首先创建一张全黑的图,即所有像素都为0,当然也可以创建另一张彩色图,作为两张图的叠加。然后两张图中每张图都可以按照一定的比例来加权叠加,正如函数名所说(addWeighted)。而我们在此创建的是一张黑色图,所以...原创 2019-08-18 10:51:14 · 2485 阅读 · 0 评论 -
基于OpenCV的图片算术操作
如果需要对两张图片做加减等算术操作,那么前提是这两张图片的通道数目、尺寸必须一致。import numpy as npfrom cv2 import cv2 def add(img1,img2): dst = cv2.add(img1,img2) cv2.imshow("add_dst",dst) def subtract(img1,img2): dst ...原创 2019-08-17 16:51:09 · 231 阅读 · 0 评论 -
人脸识别 Dlib68,Dlib81,OpenCV对比以及效果提升
最近在做一个关于换脸的项目,就是将图片中模特的脸替换成用户的脸。其中有用Dlib,也有用OpenCv,但是在输入的用户图片中,还有需要自己手动去调整的,比方说对比度,亮度,饱和度这些预处理。OpenCV版本OpenCv中有它自身自带训练好的人脸检测模型,为XML文件。下载完直接用就可以了,当然,Dlib也是。人脸检测器(默认):haarcascade_frontalface_def...原创 2019-07-24 11:56:00 · 1501 阅读 · 0 评论 -
通过OpenCV作的简单图像处理
在深度学习中,无论是人脸识别,目标检测还是其他关于图像方面的技术,都需要用到图片样本。那么样本的预处理、清洗就经常出现在我们视线中,而修改图片的颜色、对比度、色调就可以说是最基本的任务了。Python中提供了Opencv这个库,这个库有着强大的处理功能,程序员可以直接调用里边的函数来对图像进行修改颜色通道以及其他特别处理。1.灰度图在现实世界中,万物拥有大量丰富的色彩。通常,我们描绘一幅图...原创 2019-07-23 20:10:50 · 501 阅读 · 0 评论 -
汽车车牌框的位置识别
前言现在已经2020年,相信大家都经常看到进停车场前对汽车车牌的自动识别,方便、速度快、又精确。也不太清楚这个的原理到底是利用深度学习识别还是使用传统的图像处理、识别 。最近,我这里就写了一小段代码来实现对车牌框的位置进行定位。当然这里还有很多BUG了,比如说只识别了蓝色的车牌,黄色、绿色的就没有涉及到。至于识别车牌号码后续继续学习以及更新!这里先占坑了。预处理当摄像头拍摄的时候,不会自动定位到框的位置,而是整辆车的前身或者尾部都拍进去。那么这里就可以使用传统的图像处理进行定位了。具体步骤就是先去噪,原创 2020-06-27 16:21:28 · 999 阅读 · 3 评论