![](https://img-blog.csdnimg.cn/20190927151026427.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
计算机视觉CV
文章平均质量分 77
计算机视觉
不雨_亦潇潇
流水不腐,户枢不蠹
展开
-
昇思25天学习打卡营第18天|FCN图像语义分割
FCN主要用于图像分割领域,是一种端到端的分割方法,是深度学习应用在图像语义分割的开山之作。通过进行像素级的预测直接得出与原图大小相等的label map。因FCN丢弃全连接层替换为全卷积层,网络所有层均为卷积层,故称为全卷积网络。卷积化(Convolutional)使用VGG-16作为FCN的backbone。VGG-16的输入为224*224的RGB图像,输出为1000个预测值。VGG-16只能接受固定大小的输入,丢弃了空间坐标,产生非空间输出。原创 2024-07-18 21:33:14 · 979 阅读 · 0 评论 -
昇思25天学习打卡营第17天|ResNet50迁移学习
☀️ 第17天学习在实际应用场景中,由于训练数据集不足,所以很少有人会从头开始训练整个网络。普遍的做法是,在一个非常大的基础数据集上训练得到一个预训练模型,然后使用该模型来初始化网络的权重参数或作为固定特征提取器应用于特定的任务中。本章将使用迁移学习的方法对ImageNet数据集中的狼和狗图像进行分类。原创 2024-07-17 19:17:27 · 352 阅读 · 0 评论 -
昇思25天学习打卡营第16天|ShuffleNet图像分类
ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型,和MobileNet, SqueezeNet等一样主要应用在移动端,所以模型的设计目标就是利用有限的计算资源来达到最好的模型精度。ShuffleNetV1的设计核心是引入了两种操作:Pointwise Group Convolution和Channel Shuffle,这在保持精度的同时大大降低了模型的计算量。因此,ShuffleNetV1和MobileNet类似,都是通过设计更高效的网络结构来实现模型的压缩和加速。原创 2024-07-16 23:07:20 · 614 阅读 · 0 评论 -
昇思25天学习打卡营第15天|ResNet50图像分类
ResNet50网络是2015年由微软实验室的何恺明提出,获得ILSVRC2015图像分类竞赛第一名。在ResNet网络提出之前,传统的卷积神经网络都是将一系列的卷积层和池化层堆叠得到的,但当网络堆叠到一定深度时,就会出现退化问题。下图是在CIFAR-10数据集上使用56层网络与20层网络训练误差和测试误差图,由图中数据可以看出,56层网络比20层网络训练误差和测试误差更大,随着网络的加深,其误差并没有如预想的一样减小。原创 2024-07-15 23:50:13 · 949 阅读 · 0 评论 -
昇思25天学习打卡营第14天|SSD目标检测
SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的一种目标检测算法。使用Nvidia Titan X在VOC 2007测试集上,SSD对于输入尺寸300x300的网络,达到74.3%mAP(mean Average Precision)以及59FPS;对于512x512的网络,达到了76.9%mAP ,超越当时最强的Faster RCNN(73.2%mAP)。具体可参考论文[1]。two-stage方法:RCNN系列。原创 2024-07-14 23:32:22 · 994 阅读 · 0 评论 -
昇思25天学习打卡营第13天|Vision Transformer图像分类
近些年,随着基于自注意(Self-Attention)结构的模型的发展,特别是Transformer模型的提出,极大地促进了自然语言处理模型的发展。由于Transformers的计算效率和可扩展性,它已经能够训练具有超过100B参数的空前规模的模型。ViT则是自然语言处理和计算机视觉两个领域的融合结晶。在不依赖卷积操作的情况下,依然可以在图像分类任务上达到很好的效果。本案例完成了一个ViT模型在ImageNet数据上进行训练,验证和推理的过程,其中,对关键的ViT模型结构和原理作了讲解。原创 2024-07-13 20:36:51 · 646 阅读 · 0 评论 -
【opencv3】鼠标框选矩形并显示当前像素点坐标和矩形中心点坐标C++
实现目标:1)用鼠标在图中框选矩形目标,然后保存框选的图片;(2)鼠标拖动过程中要求显示框的线条以及鼠标当前像素点信息(坐标和RGB值);(3)拖动完成后单独显示框取的图像,拖动完成后cout输出框中心像素点坐标。...........................原创 2022-08-10 23:33:12 · 3318 阅读 · 0 评论 -
【opencv3】详述PnP测距完整流程(附C++代码)
1.为什么需要对摄像头进行标定?摄像头存在畸变,畸变可以拓宽视野,但会影响图像识别和测量的精度。1)相机矩阵:包括焦距(fx,fy),光学中心(Cx,Cy),完全取决于相机本身,是相机的固有属性,只需要计算一次,可用矩阵表示如下:[fx, 0, Cx;0, fy, cy;0,0,1];2) 畸变系数:畸变数学模型的5个参数 D = (k1,k2, P1, P2, k3);3)相机内参:相机矩阵和畸变系数统称为相机内参,在不考虑畸变的时候,相机矩阵也会被称为相机内参;..................原创 2022-08-09 23:32:06 · 10917 阅读 · 21 评论 -
【opencv3】滑动条调节RGB颜色阈值并输出滑动条的值
实现目标:首先对图像 RGB 色彩空间进行分割,然后根据分割出来的各个通道的图像进行二值化处理,通过滑动条可以调节二值化的阈值。如果想要从 xml 文件中读取预设阈值,并输出调节后的阈值到 xml 中,可以使用 FileStorage 类。...原创 2021-01-26 13:30:25 · 1949 阅读 · 0 评论 -
【opencv3】透视变换后帧差法检测运动物体C++
上一篇博客通过用鼠标选择特征点,完成透视变换,实现了视频视角的校正。实现目标:在透视变换的基础上,利用帧差法检测运动物体,并用矩形框出。原创 2020-12-17 12:42:12 · 431 阅读 · 0 评论 -
【opencv3】视频透视变换C++
实现目标:鼠标选中4个目标边界点,计算转换矩阵,对视频进行透视变换。原创 2020-12-17 12:31:32 · 724 阅读 · 0 评论