![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉CV
文章平均质量分 63
大叔爱学习.
所谓至明,不过至专。
展开
-
目标检测 CenterNet 模型原理与论文精读(一)
文章目录简介Backbone如何制作数据集的Ground TruthCenter的设置如何计算Loss总结简介Faster R-CNN和RetinaNet都是基于Anchor机制的。Faster R-CNN是需要RPN进行预选框的筛选,300个框左右。RetinaNet是one-stage的方法,没有RPN,直接暴力枚举所有anchor,直接做分类和回归。一个图片里只存在少量物体,但是我们枚举的框很多,如果在Faster R-CNN 300个框计算loss,会造成正负样本不均衡,loss倾向于负原创 2022-05-14 09:21:06 · 646 阅读 · 0 评论 -
目标检测 Chapter1 传统目标检测方法
文章目录目标检测问题定义介绍目标检测和图像分类、图像分割的区别目标检测问题方法传统目标检测深度学习目标检测传统 Vs 深度学习传统目标检测综述Viola-JonesHOG+SVMDPMNMS 非极大值抑制目标检测问题定义介绍目标种类与数量问题:种类不同。种类越多,难度越大。数量越多(遮挡),难度越大。目标尺度问题:同一种类的物体,也会有不同的尺度。尺度变化越大,目标检测的难度越大。尤其是在尺度非常小的时候。由于物体是运动的,所以尺度上也会变化。一张图片,他的物体和数量都是不确定的,这就是目标检测原创 2022-05-08 10:02:58 · 5005 阅读 · 1 评论 -
OpenCV 实战 Chaper2 图像处理
文章目录灰度图HSV图像阈值图像平滑图像形态学腐蚀膨胀开运算与闭运算梯度与运算礼帽与黑帽图像梯度Sobel 算子Scharr 算子Laplacian 算子Canndy 边缘检测图像金字塔图像轮廓傅立叶变换傅立叶变换的作用灰度图HSV图像阈值图像平滑卷积就是均值滤波器,比如一个3*3的都是1的卷积,和图像本身做内积,最后得到的值是图像9个像素点的求和平均值。图像形态学腐蚀膨胀开运算与闭运算梯度与运算礼帽与黑帽图像梯度Sobel 算子Gx:右减左Gy:下减上Scharr 算子L原创 2022-01-04 19:42:25 · 127 阅读 · 0 评论 -
OpenCV 实战 Chaper1 图像的基本操作
文章目录原创 2021-12-31 18:57:00 · 1232 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper14 图像生成
文章目录概念介绍生成模型MLE变分子编码器 VAEGAN 对抗生成网络常见改进GANDCGANWGANSRGANGAN在图像生成中的应用GAN在传统CV问题中的应用概念介绍生成模型生成式模型,给一个概念,然后扩展它的细节。判别模型例子:幼儿园老师给小朋友2张图片,让他们分辨猫和狗。生成模型例子:老师告诉小朋友猫和狗的概念,让他们画出来。这个要求就更高了。MLE变分子编码器 VAE绿色部分其实就是图像的压缩。保存了图像的大部分信息。如果我们自己随便写一个向量来代替绿色训练出来的向原创 2021-12-25 23:01:31 · 2422 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper13 图像描述
文章目录深度语言模型RNN 原理解析LSTM 原理解析GRU 门控循环单元图说模型原理与结构Image Captioning 图说模型NIC Neural Image CaptionAttention 注意力机制SAT模型数据集介绍深度语言模型RNN 原理解析Y是一个概率vector,最大的概率是希望输出的词。W其实是乘的上一个时间时刻的输出。这就是我们为什么可以进行时间序列的预测,因为在神经网络训练的过程中,上一个时刻和下一个时刻通过权重系数W来连接。unfold就是沿着时间展开了。原创 2021-12-20 14:51:37 · 1756 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper12 医疗图像分割
文章目录医疗影像种类与存储种类存储方式影像分割任务及数据集影像分割模型U-NET3D U-NETV-NETFC-DenseNet病理切片数据病理切片分析医疗影像种类与存储种类存储方式影像分割任务及数据集影像分割模型U-NET3D U-NETV-NETFC-DenseNet病理切片数据病理切片分析...原创 2021-12-19 17:55:19 · 1440 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper11 图像分割
文章目录语义分割反卷积反池化跳层结构Skip-Layer构建FCNDeepLabDeepLab V1CRF 条件随机场DeepLab V2DeepLab V3数据集语义分割传统CNN就是全连接层,太多权重参数,而且丢失了图像的空间信息。但是注意FC在英语里,全卷积fully convolutional 和 fully connect是一样的。当我们说FCN时,说的是全卷积。反卷积的上采样比之前的上采样方法好的是因为可以训练。跳层结构的原因是卷积卷到最后,图片很小,每一个像素点,包含了巨大的原创 2021-12-17 15:46:40 · 1904 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper10 目标检测 下
文章目录区域卷积神经网络(R-CNN)系列R-FCNYOLO系列YOLO V1YOLO V2/9000YOLO V3人脸检测和行人检测基于Darknet的YOLO实现区域卷积神经网络(R-CNN)系列R-FCN区域-全卷积网络检测网络是回归,分类网络是分类。全连接层fully connect后,相对位置就丢失了。卷积层的相对位置是不变的。所以判断位置的检测网络,我们希望全是卷积网络,而分类任务的最后一层,是全连接的也没关系。共享卷积层可以减少计算量。YOLO系列原创 2021-12-16 21:36:29 · 1397 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper9 目标检测 上
文章目录目标检测ILSVRC竞赛区域卷积网络R-CNN系列R-CNNSPP-NETFast R-CNNFaster R-CNN目标检测ILSVRC竞赛区域卷积网络R-CNN系列两个步骤:1)提取物体区域;2)对区域进行分类识别;本章所有模型都基于这个思想。但是YOLO不是。R-CNN找到2000个可能出现物体的区域,然后对所有区域进行warped region标准化,变成正方形。第3步就是CNN卷积神经网络,提取特征。第4步是放入SVM进行分类+回归Bounding box reg原创 2021-12-15 18:09:04 · 1651 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper8 图像检索
文章目录相似检索颜色、纹理、形状颜色纹理形状局部特征点调包(Bag Of Visual Word)索引加速KD-Tree局部敏感哈希(Locally Sensitive Hash)相似检索颜色、纹理、形状颜色目前用的是CIEDE2000纹理形状局部特征点调包(Bag Of Visual Word)有点像深度学习中间的一些隐藏层,某些关注眼睛,某些关注耳朵等。上面的方法是手动的,深度学习是自动的。如果加的二值化的层原创 2021-12-14 14:53:16 · 1407 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper7 图像分类
文章目录常见CNNAlexnetVGGGoogLeNetResNetResNeXtCNN设计准则常见CNNAlexnet11的卷积,说明只考虑单一的像素点的多通道,33是考虑了周边的像素点。k是控制升维或者降维的。VGGGoogLeNetFilter Concatenation 是层数的堆叠,不同于Resnet的层数的叠加。主要是提出了Batch NormalizationResNetResNeXt原创 2021-12-12 18:55:06 · 1069 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper6 深度学习基础
文章目录深度学习基础与传统神经网络的区别目标函数改进的梯度下降避免过拟合CNN初步介绍CNN基本组件池化层误差反向传播卷积层误差反向传播深度学习基础与传统神经网络的区别目标函数crossentropy收敛性更好softmax:软最大改进的梯度下降梯度下降的方式:如果前后梯度方向一致,加速学习。如果不一致,可以冲过最低点,避免马鞍点。如果是真正的谷底,可以将点带回最低点。delta是一个极小数,防止除0错误。避免过拟合Early Stoppin原创 2021-12-10 16:38:23 · 1368 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper5 神经网络与误差反向传播算法
文章目录神经网络神经元前馈网络梯度下降误差反向传播神经网络手写数字对于计算机来说,每张图是28*28个像素点,将784个高维向量输进去,通过神经网络,识别出手写数字。难点在于相同数字,手写也不同。神经元前馈网络梯度下降误差反向传播...原创 2021-12-09 16:36:59 · 1110 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper4 未有深度学习之前
文章目录图像分割基于阈值和边缘基于区域和图论Graph CutsGrab Cut人脸检测Haar-like 特征级联分类器行人检测HOG+SVMDPM图像分割传统的图像分割是基于灰度、颜色、纹理和形状。两个基本特性:不连续性和相似性。深度学习的分割是要按照语义分割出来,物体实际是什么物体要能分割出来。阈值的分割就是先画直方图,然后大于阈值的为前景/背景,小于的则相反。边缘分割是基于图像局部特征不连续性的反映,体现了灰度、颜色、纹理等图像特性的突变。基于阈值和边缘基于区域和图论原创 2021-12-08 22:20:09 · 283 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper3 图像特征与描述
文章目录颜色特征几何特征边缘 Edge角点 CornerHarris 角点Fast 角点斑点 Blob基于关键点的特殊描述子局部特征 SIFT局部特征 SURFORB 特征描述其他特征提取LBP 局部二值模式Gabor颜色特征颜色平滑几何特征边缘 Edge图片中物体不论如何变化,有很多点还是不变的。角点 CornerHarris 角点Fast 角点斑点 Blob拉普拉斯就是x,y的二阶导数,然后叠加在一起。二阶导数的极值点,就是斑点Blob。原创 2021-12-07 21:57:13 · 1017 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper2 图像预处理
文章目录图像显示与存储原理图像显示原理图像存储原理图像增强目标点运算:基于直方图的对比度运算形态学处理空间域处理卷积的应用(平滑、边缘检测、锐化等)频率域处理:傅立叶变换、小波变换图像显示与存储原理图像显示原理RGB:加法混色,越叠加越亮,越叠加越白3个颜色通道:Red、Green、Blue减法混色:越叠加越黑4通道:Cyan、Magenta、Yellow、Key图像存储原理如果是彩色图片,那么是RGB的三通道彩色图,除了Width和Height,还有Channel。Width和原创 2021-12-07 14:43:07 · 1213 阅读 · 0 评论 -
计算机视觉 Computer Vision Chaper1 概述
计算机视觉就是让计算机理解图片或者视频。A/B在计算机中颜色是一样的。让计算机拥有人类视觉的所有功能。提取图片的有用信息。重构人眼的过程。计算机视觉不受幻觉打扰,它的描述是客观的,真实的。语义感知:要理解看到的东西几何属性:VR的应用特定领域:图像分类ImageNet。计算机读片(医疗)总的来说,计算机和人差距还是很大的。分割:一张图片里,可能不是一个物品,可以检测出来很多物体,并将他们分开来。每一个像素归为哪一个物体。为什么计算机视觉难,我们看图片,知道是爱因斯坦,..原创 2021-12-06 12:54:13 · 814 阅读 · 1 评论