![](https://img-blog.csdnimg.cn/20190927151117521.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
计算机视觉
计算机视觉
我是天才很好
深度学习算法工程师
github: https://github.com/wstchhwp
个人邮箱:1103540209@qq.com
展开
-
计算机视觉、计算机图形学、数字图像处理
计算机图形学的输入是模型,输出是图像(像素)计算机视觉的输入是图像(摄像机拍摄的照片或视频),输出是模型数字图像处理的输入是图像(像素),输出也是图像(像素)原创 2020-10-12 21:45:20 · 475 阅读 · 0 评论 -
cv2.VideoCapture()和cv2.VideoWriter_fourcc()
# 环境:opencv 3.4.0 python 3.5.2# 读取视频import cv2 cap = cv2.VideoCapture('video.avi')# 读取摄像头,0为摄像头索引,当有多个摄像头时,从0开始编号cap = cv2.VideoCapture(0)# 从视频或摄像头中读取一帧(即一张图像),返回是否成功标识ret(True代表成功,False代表失败),img为读取的视频帧ret, frame = cap.read()#完整的读取视频流并播放视频流代码原创 2020-10-09 12:51:52 · 13224 阅读 · 1 评论 -
计算机视觉三大顶级会议ICCV,CVPR,ECCV
ICCV 的全称是 IEEE International Conference on Computer Vision,国际计算机视觉大会,是计算机视觉方向的三大顶级会议之一,通常每两年召开一次,2005 年 10 月曾经在北京召开。会议收录论文的内容包括:底层视觉与感知,颜色、光照与纹理处理,分割与聚合,运动与跟踪,立体视觉与运动结构重构,基于图像的建模,基于物理的建模,视觉中的统计学习,视频监控,物体、事件和场景的识别,基于视觉的图形学,图片和视频的获取,性能评估,具体应用等。ICCV是计算机视觉领域最高转载 2020-09-27 16:00:24 · 7425 阅读 · 0 评论 -
CNN中stride(步幅)和padding(填充)的详细理解
步幅:卷积核经过输入特征图的采样间隔填充:在输入特征图的每一边添加一定数目的行列,使得输出的特征图的长、宽 = 输入的特征图的长、宽两个参数的核心:设置步幅的目的:希望减小输入参数的数目,减少计算量。设置填充的目的:希望每个输入方块都能作为卷积窗口的中心。在边长=4的输入矩阵各边填充1层,全部填充0,采用边长=3的卷积核,全部卷积核的中心构成原输入。首先从一个问题入手:问题:一个尺寸 a*a的特征图,经过b*b的卷积层,步幅(stride)=c,填充(padding)=d, 请计转载 2020-09-09 16:35:55 · 10990 阅读 · 2 评论 -
python批量修改文件夹内所有图片的名字
import os# 图片输入路径path = '/media/li_hiayu/D/Caltech/JPEG'# 图片输出路径,用来存储修改名字后图片的位置,当然你也可以覆盖在path中outpath = '/media/li_hiayu/D/Caltech/JPEGImages'if not os.path.exists(outpath): os.makedirs(outpath)# os.listdir(path)历遍path路径并获取文件名存储到列表中并返回for img原创 2020-09-03 16:59:11 · 2787 阅读 · 0 评论 -
深度卷积神经网络及各种改进
文章目录1、残差网络2、不同大小卷积核并行卷积3、利用(1,x),(x,1)卷积代替(x,x)卷积4、采用瓶颈(Bottleneck)结构5、深度可分离卷积6、改进版深度可分离卷积+残差网络7、倒转残差(Inverted residuals)结构8、并行空洞卷积1、残差网络这个网络主要源自于Resnet网络,其作用是:将靠前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献。实验表明,残差网络更容易优化,并且能够通过增加相当的深转载 2020-08-09 13:26:50 · 7755 阅读 · 1 评论 -
CV数据预处理
文章目录1. 学习前言2. 处理长宽不同的图片3. 数据增强3.1、在数据集内进行数据增强3.2、在读取图片的时候数据增强3.3、目标检测中的数据增强1. 学习前言进行训练的话,如果直接用原图进行训练,也是可以的(就如我们最喜欢Mnist手写体),但是大部分图片长和宽不一样,直接resize的话容易出问题。除去resize的问题外,有些时候数据不足该怎么办呢,当然要用到数据增强啦。2. 处理长宽不同的图片对于很多分类、目标检测算法,输入的图片长宽是一样的,如224∗224224*224224∗22转载 2020-08-09 12:50:20 · 1721 阅读 · 0 评论 -
CNN中feature map、卷积核、卷积核个数、filter、channel的概念解释,以及CNN 学习过程中卷积核更新的理解
文章目录1. feather map的理解2. feather map 是怎么生成的?3. 多个feather map的作用是什么?4. 卷积核的理解5. 卷积核的形状6. 卷积核个数的理解7. 卷积核的运算过程8. filter的理解9. 理解tensorflow等框架中的参数 channel(feather map、卷积核数量)10. CNN的学习过程:更新卷积核的值(更新提取的图像特征)1...转载 2019-12-12 09:21:27 · 2184 阅读 · 2 评论 -
对卷积神经网络认识的进一步加强(卷积变种:分组卷积、空洞卷积、深度可分离卷积、可形变卷积)
一、分组卷积 Group convolutionGroup convolution分组卷积,最早在AlexNet中出现,由于当时的硬件资源有限,训练AlexNet时卷积操作不能全部放在同一个GPU处理,因此作者把feature maps分给多个GPU分别进行处理,最后把多个GPU的结果进行融合。二、卷积核一定越大越好?-- 3×3卷积核AlexNet中用到了一些非常大的卷积核,比如11×11、5×5卷积核,之前人们的观念是,卷积核越大,receptive field(感受野)越大,看到的图片信息越多转载 2020-06-13 10:24:52 · 1490 阅读 · 0 评论 -
关于RGBA颜色值
RGBA的意思是(Red-Green-Blue-Alpha)它是在RGB上扩展包括了“alpha”通道,运行对颜色值设置透明度。在RGBA中,四个数字以逗号分隔开,前面三个数字标识这个颜色的RGB值,这个设置和RGB并没有任何区别,RGBA也可以设置为百分比,后面的数字代表透明度,范围在0-1之间。1表示不透明,0表示全透明。前三个值(红绿蓝)的范围为0到255之间的整数或者0%到100%之间...原创 2020-04-22 11:59:16 · 12016 阅读 · 0 评论 -
CNN笔记:通俗理解卷积神经网络
文章目录1.人工神经网络1.1 神经元1.2 激活函数1.3 神经网络2.卷积神经网络之层级结构3. CNN之卷积计算层3.1 CNN怎么进行识别3.2 什么是卷积3.3 图像上的卷积3.4 GIF动态卷积图4.CNN之激励层与池化层4.1 ReLU激励层4.2 池化pool层1.人工神经网络1.1 神经元神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线...转载 2020-04-18 12:22:46 · 871 阅读 · 0 评论 -
Pascal VOC 数据集
1. 概述Pascal VOC2012数据集主要是针对视觉任务中监督学习提供标签数据,它有20个类别:Person: personAnimal: bird, cat, cow, dog, horse, sheepVehicle: aeroplane, bicycle, boat, bus, car, motorbike, trainIndoor: bottle, chair, di...原创 2020-01-10 10:52:28 · 1319 阅读 · 0 评论 -
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
文章目录一、目标检测常见算法二、传统的目标检测算法2.1 从图像识别的任务说起图像识别(classification)定位的问题的解决思路有哪些?2.2 物体检测(Object Detection)三、候选区域/窗 + 深度学习分类3.1 R-CNN横空出世3.2 SPP Net3.3 Fast R-CNN3.4 Faster R-CNN四、基于深度学习的回归方法4.1 YOLO (CVPR201...转载 2019-12-13 10:13:57 · 505 阅读 · 0 评论 -
ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)
ILSVRC(ImageNet Large Scale Visual Recognition Challenge)是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平。ImageNet数据集是ILSVRC竞赛使用的是数据集,由斯坦福大学李飞飞教授主导,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为...转载 2020-01-02 08:56:32 · 18537 阅读 · 0 评论 -
深度学习与计算机视觉概述(二)
机器学习训练图像的流程深度学习图像识别流程转载 2019-12-13 13:42:16 · 283 阅读 · 0 评论 -
深度学习与计算机视觉概述(一)
文章目录众星捧月的深度学习前深度学习时代的计算机视觉几个(半)成功例子仿生学角度看深度学习卷积的概念操作的实例:LeNet网络压在骆驼身上的最后一根稻草为什么时隔20年卷土重来?深度学习在视觉上的应用1.人脸识别2.图片问答问题3.物体检测问题3.1 Region CNN3.2 Faster R-CNN方法3.3 YOLO3.4 SSD4.物体跟踪基于嵌入式系统的深度学习人工智能是人类一个非常美...转载 2019-11-29 09:45:16 · 835 阅读 · 0 评论 -
nn.ConvTranspose2d原理,深度网络如何进行上采样?
文章目录1.逆卷积ConvTranspose2d(fractionally-strided convolutions)是什么?2.怎么求逆卷积ConvTranspose2d(fractionally-strided convolutions)?3.逆卷积和卷积的关系4.参数详解在生成图像中,我们需要不断的扩大图像的尺寸。目前在深度学习中,ConvTranspose2d是其中一个方法。别名:c...转载 2019-12-12 15:15:18 · 2714 阅读 · 0 评论