![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OpenCV
文章平均质量分 87
T1.Faker
此人很懒,什么都没有写
展开
-
Colorful Image Colorization灰度图像上色
作者的目标是将灰度输入通道XXXX∈RH×W×1X∈RH×W×1映射到关联的两个颜色通道YYY,即YFXYFX。Y∈RH×W×2Y∈RH×W×2为了实现这一任务,作者采用CIE Lab色彩空间,并使用欧氏损失函数来度量预测颜色和真实颜色之间的距离。然而,由于颜色上色问题具有固有的多模态性和歧义性,欧氏损失函数不够鲁棒,容易产生灰暗和褪色的结果。原创 2023-11-02 10:30:46 · 390 阅读 · 0 评论 -
ISR实现RDN图像增强
这项研究提出了一种新颖的图像超分辨率(SR)解决方案,即残差稠密网络(RDN),以应对SR领域的挑战。RDN的设计主要集中在充分利用图像中的分层特征,旨在提高性能并提供更清晰的超分辨率图像。RDN的关键特点分层特征利用:RDN充分利用了来自卷积神经网络的各个层次的分层特征。这有助于更好地理解图像的不同部分,并为超分辨率提供更多信息。残差稠密块(RDB):RDN引入了残差稠密块,这是一种密集连接的卷积层,用于提取图像的丰富局部特征。这有助于保留图像中的细节和纹理。原创 2023-10-18 15:02:45 · 334 阅读 · 0 评论 -
计算机视觉颜色校正方法
sRGB(standard Red Green Blue)是由Microsoft影像巨擘共同开发的一种彩色语言协议,它提供了一种标准方法来定义色彩,让显示、打印和扫描等各种计算机外部设备和应用软件对于色彩有一个共通的语言。白平衡(White Balance,简称WB)是一项重要的图像处理任务,旨在确保不同照明条件下拍摄的图像中的颜色保持一致。然而,传统的白平衡编辑方法在纠正错误的白平衡设置时面临一些挑战,特别是由于相机综合信号处理器(ISP)的非线性渲染效果。原创 2023-07-04 17:00:16 · 4501 阅读 · 0 评论 -
将视频转为幻灯片图像:利用OpenCV实现视频资料转换的指南
背景减法是一种常用的计算机视觉技术,用于从视频中提取前景对象并去除背景。它通过建立背景模型,将视频帧与该模型进行比较,并检测出与背景不同的像素,从而确定前景区域。背景减法在很多领域都有广泛的应用,如运动检测、目标跟踪、视频分析等。原创 2023-06-25 16:57:58 · 1243 阅读 · 0 评论 -
opencv如何使用GPU的三种方法
我在工作实验涉及到图像和视频处理时,通常使用opencv提供的库来做处理,虽然OpenCV是一个广泛使用的库,它提供了丰富的功能和工具。然而,有时候在处理大量图片或视频时,我们可能会面临速度受限的问题。opencv执行图像处理,就跟我们电脑一样,打游戏CPU是来加载处理数据的,显卡(GPU)是来渲染图像。下面由我助理来介绍如何本文的内容吧。原创 2023-06-21 16:31:59 · 15995 阅读 · 7 评论 -
Mediapipe实时3D目标检测和跟踪(自动驾驶实现)
3D目标检测是根据物体的形状、位置和方向来识别和定位物体的任务。在2D目标检测中,被检测到的物体仅表示为矩形边界框。3D目标检测任务通过预测物体周围的包围框,可以获取物体的三维位置信息。3D目标检测在各行各业都有广泛的应用。一些常见的用途包括:🎯 机器人技术🎯 自动驾驶车辆🎯 医学影像MediaPipe Objectron是由Google的MediaPipe团队开发的计算机视觉流水线,可以使用Objectron数据集实时实现3D目标检测和跟踪。原创 2023-06-14 16:23:32 · 5371 阅读 · 5 评论 -
深度学习如何训练出好的模型
深度学习在近年来得到了广泛的应用,从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是,要训练出一个高效准确的深度学习模型并不容易。不仅需要有高质量的数据、合适的模型和足够的计算资源,还需要根据任务和数据的特点进行合理的超参数调整、数据增强和模型微调。在本文中,我们将会详细介绍深度学习模型的训练流程,探讨超参数设置、数据增强技巧以及模型微调等方面的问题,帮助读者更好地训练出高效准确的深度学习模型。原创 2023-02-23 15:57:40 · 14203 阅读 · 13 评论 -
OpenCV入门(C++/Python)- 使用OpenCV色彩空间(七)
在本教程中,了解计算机视觉中使用的流行色彩空间,并将其用于基于颜色的分割。原创 2022-12-10 14:52:24 · 1027 阅读 · 0 评论 -
OpenCV入门(C++/Python)- 使用OpenCV标注图像(六)
一旦有了标注图像,标注视频帧似乎也同样简单。这是因为视频中的每一帧都被表示为图像。我们将在这里演示如何用几何形状和文本标注图像,示例代码如下:PythonC++用颜色线标注图像在上面示例中,使用OpenCV中的line()函数,用颜色线标注图像。在调用line()函数之前,使用以下命令创建原始图像的副本:副本将确保对图像所做的任何更改都不会影响原始图像。在C++中,首先为原始图像的副本创建一个矩阵。下面是line()函数的语法:第一个参数是图像。接下来的两个参数是直线的起点和终点。从点A(原创 2022-12-06 11:11:47 · 1715 阅读 · 0 评论 -
OpenCV入门(C++/Python)- 使用OpenCV进行图像旋转和转换(五)
近年来,随着手机具有这种内置功能,图像编辑变得越来越流行,它可以让您裁剪、旋转图像并对图像进行更多处理。在这篇文章中,我们将探索和学习这些图像编辑技术。具体来说,我们将学习如何:基本图像转换操作图像的旋转和平移是图像编辑中最基本的操作之一。两者都属于更广泛的仿射变换类别。因此,在研究更复杂的转换之前,您应该首先学习使用OpenCV中可用的函数旋转和平移图像。查看下面的图片,我们将在这里的所有转换示例中使用它。PythonC++使用OpenCV的图像旋转通过定义变换矩阵MMM,可以将图像旋转一定角度θ\原创 2022-12-05 16:45:35 · 3260 阅读 · 0 评论 -
OpenCV入门(C++/Python)-使用OpenCV裁剪图像(四)
裁剪是为了从图像中删除所有不需要的物体或区域。甚至突出显示图像的特定功能。使用OpenCV裁剪没有特定的功能,NumPy数组切片是工作。读取的每个图像都存储在2D数组中(对于每个颜色通道)。只需指定要裁剪区域的高度和宽度(以像素为单位),就可以完成以下代码片段展示了如何使用Python和C++裁剪图像。在例子的进一步,您将详细了解这些。PythonC++上面的代码读取并显示图像及其尺寸。尺寸不仅包括二维矩阵的宽度和高度,还包括通道的数量(例如,RGB图像有3个通道——红色、绿色和蓝色)。让我们尝试裁原创 2022-12-05 13:22:41 · 5135 阅读 · 3 评论 -
OpenCV入门(C++/Python)- 使用OpenCV调整尺寸大小(三)
使用OpenCV调整图像大小。要调整图像的大小,可以根据每个轴(高度和宽度)进行缩放,考虑指定的缩放因素,或者只需设置所需的高度和宽度。调整图像大小时:各种插值技术发挥作用来完成这些操作。OpenCV中有几种方法可供选择,选择通常取决于特定的应用程序。PythonC++在开始调整图像的大小之前,先了解其原始尺寸。要获取图像的大小:Python中的image.shape返回三个值:高度、宽度和通道数。在C++中:也可以使用size()函数获得上述结果。PythonC++这里需要注意的一件重要事情是,原创 2022-12-05 11:08:57 · 5657 阅读 · 0 评论 -
OpenCV入门(C++/Python)- 使用OpenCV读取和编写视频(二)
如果有要读取的帧,您可以使用imshow()在窗口中显示当前帧,否则退出循环。在这里下,通过指定3(CAP_PROP_FRAME_WIDTH)和4(CAP_PROP_FRAME_HEIGHT)来检索帧宽度和高度。在下面的示例中,我们提供了数字值5和7,它们对应于帧速(CAP_PROP_FPS)和帧计数(CAP_PROP_FRAME_COUNT)。此外,还有其他需要的功能,如cv2.imshow()、cv2.waitKey()和get()方法,该方法用于读取视频元数据,如帧高度、宽度、fps等。原创 2022-12-02 15:36:27 · 2589 阅读 · 0 评论 -
OpenCV入门(C++/Python)- 使用OpenCV读取、显示和写入图像(一)
读取、显示和写入图像是图像处理和计算机视觉的基础。即使裁剪、调整大小、旋转或应用不同的过滤器来处理图像,您也需要首先读取图像。因此,掌握这些基本操作很重要。原创 2022-12-02 15:36:03 · 2876 阅读 · 0 评论 -
Opencv生成视频转h264格式
【代码】Opencv生成视频转h264格式。原创 2022-10-18 14:11:20 · 2908 阅读 · 1 评论 -
在linux下使用ffmpeg方法
ffmpeg是专门用于处理音频视频的包,它不属于python内置包,FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多code都是从头开发的。ffmpeg支持在linux、window、Mac OS等操作系统进行编译运行。原创 2022-09-20 14:39:34 · 10598 阅读 · 1 评论 -
OpenCV加载深度学习框架与模型
OpenCV加载深度学习框架与模型1.DNN模块模块简介2.DNN模块常用函数方法2.1 cv2.dnn.blobFromImage2.3 cv2.dnn.NMSBoxes2.4 cv2.dnn.readNet2.4.1 cv2.dnn.readNetFromCaffe2.4.2 cv2.dnn.readNetFromDarknet2.4.3 cv2.dnn.readNetFromTensorflow2.4.4 cv2.dnn.readNetFromTorch3.OpenCV使用预训练模型做应用3.1 加载原创 2021-12-15 16:53:39 · 9773 阅读 · 0 评论 -
Mediapipe三维实时人体关键点检测与追踪(一)
Mediapipe三维实时人体关键点检测与追踪1.Mediapipe简介2.Mediapipe姿态检测器3.Mediapipe图像姿态检测4.Mediapipe摄像头实时姿态检测1.Mediapipe简介Google出了一个开源的、跨平台的、可定制化的机器学习解决方案工具包,给在线流媒体(当然也可以用于普通的视频、图像等)提供了机器学习解决方案。感兴趣的同学可以打开这个网址了解详情:https://mediapipe.dev/它提供了手势、人体姿势、人脸、物品等识别和追踪功能,并提供了C++、Pyt原创 2021-11-21 20:36:50 · 26976 阅读 · 7 评论 -
计算机视觉 文本检测与文本识别 (一)
文本检测传统文本检测形态学:MSER+NMS深度学习文本检测分类基于候选框的文本检测基于分割的文本检测基于混合的文本检测传统文本检测当前应用中面对文本检测会遇到很多难点:文本图像的背景多样化,很多背景可能像素情况与文本结构相似文本的形状和方向多样化,可能图像中文本的摆放方向是倾斜的,横向的文本的颜色,字体多样化图像中受光照等环境因素影响由于这些检测上的难点,传统基于opencv通过形态学、MSER+NMS的方法无法实现实际场景的文本检测。因此对于复杂场景下文本检测大多基于深度学习算法实现。原创 2021-08-16 10:34:01 · 1307 阅读 · 0 评论 -
计算机视觉 - 图像相似度
在计算机视觉中如何识别两张图片是否相似,可以通过图像的像素值,根据颜色特征来识别是否为相似图片计算图片的相似度方法1.像素方差1.1缩放图片1.2灰度处理1.3计算图像每行的平均值1.4计算方差1.5比较方差2.哈希值计算2.1平均值哈希2.1.1图片缩放成8*82.1.2灰度化图像G2.1.3计算整个灰度图像的像素平均值avg2.1.4计算hash图像H2.2感知哈希2.2.1图片缩放32*322.2.2灰度化图像G1G_{1}G12.2.3计算得到图像G的离散余弦变换的图像G2G_{2}G22.2原创 2021-08-11 14:16:57 · 1141 阅读 · 0 评论