![](https://img-blog.csdnimg.cn/d47609f8d1f3450ea7e64a477ddadf0a.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
计算机视觉的应用
文章平均质量分 92
计算机视觉是一种利用计算机软件和硬件来实现图像和视频数据理解、处理和分析的科学领域。计算机视觉的目的是实现让计算机像人类一样识别图像中的对象、场景、关系等信息。 计算机视觉在许多领域都有广泛的应用,如自动驾驶、医疗影像分析、OCR、图像分类、图形分割处理等。
微学AI
人工智能高级研发者,名校硕士学历毕业,拥有10项AI领域发明专利,主攻深度学习实战案例、机器学习实战案例、大模型实战项目,研究方向包括:深度学习应用技巧,Pytorch搭建模型,机器学习经典模型,计算机视觉,自然语言处理,知识图谱,大模型实战(包括:ChatGLM、通义千问、百川、LLaMA、书生等开源模型的微调技巧、Qlora微调、提示词工程、思维链、RAG技术、LangChain框架、智能体应用项目、大模型私有化部署)。项目主要运用于医疗健康、政府文档、教育、金融、生物学、物理学、企业管理等领域。
展开
-
计算机视觉的应用31-目标检测最新模型YOLOv10的介绍与代码快速实现
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用31-目标检测最新模型YOLOv10的介绍与代码快速实现. YOLOv10是YOLO系列的最新版本,它是清华大学的研究人员在Ultralytics Python包的基础上,引入了一种新的实时目标检测方法.它在后处理和模型架构两个方面进行了显著的改进。YOLOv10提出了一种一致的双重分配策略,这种策略结合了一对多和一对一分配策略的优势,提高了效率并保持了性能。在训练过程中,模型可以利用一对多分配的丰富监督信号,而在推理过程中则使用一对一分配的预测结果。原创 2024-05-30 17:37:17 · 905 阅读 · 0 评论 -
计算机视觉的应用30-基于深度卷积神经网络CNN模型实现物体表面缺陷检测技术的项目
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用30-基于深度卷积神经网络CNN模型实现物体表面缺陷检测技术的项目主要包括:物体表面缺陷检测技术项目介绍,数据构造,模型介绍。 物体表面缺陷检测技术是工业自动化和质量控制领域的一项关键技术,它通过分析物体表面的图像来识别和分类各种缺陷,如划痕、凹陷、裂纹等。基于深度卷积神经网络(CNN)的模型因其强大的特征学习和模式识别能力,在这一领域得到了广泛应用。原创 2024-05-13 20:36:20 · 1444 阅读 · 3 评论 -
计算机视觉的应用29-卷积神经网络(CNN)中的变种:分组卷积、转置卷积、空洞卷积的计算过程
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用29-卷积神经网络(CNN)中的变种:分组卷积、转置卷积、空洞卷积的计算过程。分组卷积将输入通道分为几组,对每组独立进行卷积操作,以减少计算量和模型参数。转置卷积也称为反卷积,它通过将输入特征图的元素扩展到更高维度的输出特征图来执行上采样。空洞卷积通过在输入特征图上引入“空洞”或“间隙”来增加感受野,从而在不增加额外参数的情况下扩大卷积核的有效覆盖范围。原创 2024-04-27 13:14:28 · 1502 阅读 · 2 评论 -
计算机视觉的应用28-基于OpenPose算法的实际应用,实例代码实现OpenPose算法的原理
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用28-基于OpenPose算法的实际应用,OpenPose算法的原理与结构。OpenPose是一种先进的实时人体关键点检测和全身姿态估计的深度学习框架,由 Carnegie Mellon University 和 Adobe Research 开发。其主要原理是通过深度卷积神经网络(CNN)和条件随机场(CRF)相结合的方式,对图像或视频中的多个人体进行全身姿态估计和关键点检测。原创 2024-04-11 10:50:07 · 1850 阅读 · 0 评论 -
计算机视觉的应用27-关于VoVNetV2模型的应用场景,VoVNetV2模型结构介绍
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用27-关于VoVNetV2模型的应用场景,VoVNetV2模型结构介绍。VoVNetV2(Visual Object-Driven Representation Learning Network Version 2)是一种深度学习模型,主要用于计算机视觉领域中的目标检测任务。该模型通过引入“单阶段逐点卷积”的核心设计理念,有效改进了特征图的生成和利用效率,从而在处理大规模图像数据时能够实现更高效的计算性能和更高的检测精度。原创 2024-03-30 18:02:08 · 863 阅读 · 0 评论 -
计算机视觉的应用26-关于Fast-R-CNN模型的应用场景,Fast-R-CNN模型结构介绍
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用26-关于Fast-R-CNN模型的应用场景,Fast-R-CNN模型结构介绍。Fast R-CNN是一种深度学习模型,主要用于目标检测任务,尤其适用于图像中物体的识别与定位。该模型在基于区域的卷积神经网络(R-CNN)系列中具有重要地位,其设计旨在提升检测速度和效率。原创 2024-03-29 16:23:58 · 1322 阅读 · 0 评论 -
计算机视觉的应用25-关于Deeplab系列语义分割模型的应用场景,以及空洞卷积的介绍
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用25-关于Deeplab系列语义分割模型的应用场景,以及空洞卷积的介绍。Deeplab是Google研发的一系列深度学习模型,主要用于图像语义分割任务,其在众多应用场景中展现出卓越性能,如自动驾驶、医学影像分析、遥感图像处理、无人机场景理解等。该模型通过精确地对图像中的每个像素进行分类,实现图像内容的细粒度理解与解析。原创 2024-03-29 11:18:34 · 1050 阅读 · 0 评论 -
计算机视觉的应用24-ResNet网络与DenseNet网络的对比学习,我们该如何选择。
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用24-ResNet网络与DenseNet网络的对比学习,我们该如何选择。在计算机视觉领域,ResNet(残差网络)和DenseNet(密集网络)都是深度学习模型中的佼佼者,它们在许多视觉任务中都取得了出色的成绩。选择ResNet还是DenseNet取决于具体的应用场景、数据集特性、计算资源、模型复杂度以及性能需求等因素。原创 2024-02-20 20:38:51 · 1856 阅读 · 1 评论 -
计算机视觉的应用23-OpenAI发布的文本生成视频大模型Sora的原理解密
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用23-OpenAI发布的文本生成视频大模型Sora的原理解密。本文概况性地将Sora模型生成视频主要分为三个步骤:视频压缩网络、空间时间潜在补丁提取以及视频生成的Transformer模型。原创 2024-02-19 17:03:11 · 1912 阅读 · 0 评论 -
深度学习技巧应用32-在YOLOv5模型上使用TensorRT进行加速的应用技巧
大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用32-在YOLOv5模型上使用TensorRT进行加速的应用技巧,TensorRT是NVIDIA公司提供的一个深度学习推理(inference)优化器和运行时库。它专门为生产环境下的高性能深度学习推理提供优化支持。TensorRT可以加速深度学习模型在NVIDIA GPU上的推理速度,降低延迟和提升吞吐量,这对于实时应用如自动驾驶、机器人、AI助手等场合至关重要。原创 2024-01-11 15:30:05 · 676 阅读 · 1 评论 -
计算机视觉的应用22-基于计算机视觉领域与VR虚拟现实眼镜,构思考虑远程协助独居老人生活起居的应用
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用22-基于计算机视觉领域与VR虚拟现实眼镜,构思考虑远程协助独居老人生活起居的应用,在当下信息科技飞速发展的社会背景下,老龄化问题日益凸显。越来越多的老年人选择独居,但由于身体原因无法完全自理。为了解决这一问题,我们需要寻求创新的解决方案。本文将介绍一种基于虚拟现实(VR)眼镜和远程操控机器人的新方法,旨在帮助老年人改善生活质量。原创 2023-12-20 19:13:22 · 1727 阅读 · 0 评论 -
人工智能(pytorch)搭建模型22-基于pytorch搭建SimpleBaseline(人体关键点检测)模型,并详细介绍该网络模型与代码实现
大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型22-基于pytorch搭建SimpleBaseline(人体关键点检测)模型,并详细介绍该网络模型与代码实现。本文将介绍关于SimpleBaseline模型的原理,以及利用pytorch框架搭建模型,以及它的应用场景。SimpleBaseline模型是一个用于人体关键点检测的深度学习模型。它可以用来检测人体姿势中的关键点,如头部、肩膀、手肘、手腕、臀部、膝盖和脚踝等关键点。SimpleBaseline模型结合了卷积神经网络(CNN)原创 2023-12-11 19:38:35 · 875 阅读 · 0 评论 -
深度学习实战66-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图
大家好,我是微学AI,今天给大家介绍一下深度学习实战65-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图。本文我将介绍自动驾驶技术及其应用场景,并重点阐述了基于计算机视觉技术下的自动驾驶。自动驾驶技术是一种利用人工智能和计算机科学实现无人驾驶的技术,通过感知技术、定位技术、规划技术和控制技术等多个方面的技术来实现汽车的运动控制和路线规划。原创 2023-12-07 17:27:05 · 2005 阅读 · 0 评论 -
深度学习实战65-人脸检测模型LFFD的搭建,LFFD模型的架构与原理的详细介绍
大家好,我是微学AI,今天给大家介绍一下深度学习实战64-人脸检测模型LFFD的搭建,LFFD模型的架构与原理的详细介绍。LFFD(Light and Fast Face Detector)模型是一种用于人脸检测的深度学习模型,其设计旨在实现轻量级和快速的人脸检测。本文将详细介绍LFFD模型的定义、优点、原理、结构、训练过程和预测过程。原创 2023-12-07 16:02:37 · 250 阅读 · 0 评论 -
深度学习实战64-黑白照片着色的模型应用,快速部署实现黑白图片快速上色的功能
大家好,我是微学AI,今天给大家介绍一下深度学习实战64-黑白照片着色的模型应用,快速部署实现黑白图片快速上色的功能。图片上色是一个具有多模态不确定性和高度不适定性的挑战性问题。直接训练深度神经网络通常会导致错误的语义颜色和低色彩丰富度。虽然基于Transformer的方法可以提供更好的结果,但它们通常依赖于手工设计的先验知识,具有较差的泛化能力,并引入颜色渗透效应。为了解决这些问题,我们提出了DDColor,一种具有双解码器的端到端图像着色方法。我们的方法包括一个像素解码器和一个基于查询的颜色解码器。原创 2023-12-06 12:57:06 · 305 阅读 · 0 评论 -
计算机视觉的应用21-基于含有注意力机制的CoAtNet模型的图像分类任务实现,利用pytorch搭建模型
大家好,我是微学AI,今天我给大家介绍一下计算机视觉的应用21-基于注意力机制CoAtNet模型的图像分类任务实现,加载数据进行模型训练。本文我们将详细介绍CoAtNet模型的原理,并通过一个基于PyTorch框架的实例,展示如何加载数据,训练含有注意力机制的CoAtNet模型,从操作上理解该模型。原创 2023-12-02 15:50:54 · 1299 阅读 · 1 评论 -
深度学习实战63-利用自适应混合金字塔网络实现人脸皮肤美颜效果,快速部署与实现一键美颜功能
大家好,我是微学AI,今天给大家介绍一下深度学习实战63-利用自适应混合金字塔网络实现人脸皮肤美颜效果,快速部署与实现一键美颜功能。在本文中,我将介绍一种新颖的自适应混合金字塔网络(ABPN),该网络可以实现对超高分辨率照片的快速局部修饰。该网络主要由两个组件组成:一个上下文感知的局部修饰层(LRL)和一个自适应混合金字塔层(BPL)。原创 2023-12-02 12:04:01 · 293 阅读 · 0 评论 -
计算机视觉的应用20-图像生成模型(Stable Diffusion)的原理详解与相关项目介绍
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用20-图像生成模型:Stable Diffusion模型的原理详解与相关项目介绍。大家知道现在各个平台发的各种漂亮的女生,这些漂亮的图片是怎么生成的吗,其实它们底层原理就是用到了Stable Diffusion模型。Stable Diffusion是一种基于深度学习的图像生成方法,旨在生成高质量、逼真的图像。该项目利用稳定扩散过程,通过逐渐模糊和清晰化图像来实现图像生成的过程。这种方法在图像生成领域具有广泛的应用,包括艺术创作、虚拟场景生成、数据增强原创 2023-11-29 15:41:56 · 896 阅读 · 0 评论 -
计算机视觉的应用19-基于pytorch框架搭建卷积神经网络CNN的卫星地图分类问题实战应用
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用19-基于pytorch框架搭建卷积神经网络CNN的卫星地图分类问题实战应用。随着遥感技术和卫星图像获取能力的快速发展,卫星图像分类任务成为了计算机视觉研究中一个重要的挑战。为了促进这一领域的研究进展,卫星图像分类问题数应运而生。本文将详细介绍遥感卫星图片分类项目,包括其背景、卫星图像分类数据集构建流程、数据集特点以及在卫星图像分类任务中的应用。原创 2023-11-23 11:29:27 · 1604 阅读 · 0 评论 -
计算机视觉的应用18-一键抠图人像与更换背景的项目应用,可扩展批量抠图与背景替换
一键人像抠图与更换背景的应用广泛,例如在摄影后期制作、影视制作、广告设计等领域。只需要一键就能准确抠出人像,再将人像放置在新的背景之中,极大地提高了工作效率。原创 2023-11-18 12:05:40 · 624 阅读 · 2 评论 -
计算机视觉的应用17-利用CrowdCountNet模型解决人群数量计算问题(pytorch搭建模型)
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用17-利用CrowdCountNet模型解决人群数量计算问题(pytorch搭建模型)。本篇文章,我将向大家展示如何使用CrowdCountNet这个神奇的工具,以及它是如何利用深度学习技术来解决复杂的人群计数问题。让我们一起进入这个充满活力和创新的世界,开启图像和视频中人群数量计算的新篇章!原创 2023-11-16 15:21:52 · 978 阅读 · 0 评论 -
计算机视觉的应用16-基于pytorch框架搭建的注意力机制,在汽车品牌与型号分类识别的应用
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用16-基于pytorch框架搭建的注意力机制,在汽车品牌与型号分类识别的应用,该项目主要引导大家使用pytorch深度学习框架,并熟悉注意力机制模型的搭建,这个项目提供了一个深度学习的舞台,让我们能够设计和训练一个卷积神经网络+注意力机制的模型。这个模型就像是一台强大的汽车引擎,能够从汽车图片中提取出独特的特征。原创 2023-11-15 16:36:24 · 672 阅读 · 0 评论 -
计算机视觉的应用15-图片旋转验证码的角度计算模型的应用,解决旋转图片矫正问题
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用15-图片旋转验证码的角度计算模型的应用,解决旋转图片矫正问题,在CV领域,图片旋转验证码的角度计算模型被广泛应用于解决旋转图片矫正问题,有效解决机器识别图片验证码的问题。旋转图片验证码常用于验证用户身份,但由于图片可能被以不同角度旋转,识别难度比较大。本文提出了一种基于深度学习的角度计算模型,能够准确估计旋转图片的角度,通过旋转角度进行自动矫正。原创 2023-09-15 18:35:21 · 1251 阅读 · 1 评论 -
计算机视觉的应用14-目标检测经典算法之YOLOv1-YOLOv5的模型架构与改进过程详解,便于记忆
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用14-目标检测经典算法之YOLOv1-YOLOv5的模型架构与改进过程详解,便于记忆。YOLO(You Only Look Once)是一种目标检测深度学习模型。想象一下,传统的目标检测方法就像侦探一样,需要仔细观察整个场景,逐个研究每个细节来找出目标。但YOLO却跟超级英雄一样,只需要一眼扫过整个画面,就能立即捕捉到所有的目标。YOLO可以实现如此高效的目标检测,是因为它将目标检测问题转化为了一个回归问题。它通过一个神奇的神经网络,在一次前向传播中,原创 2023-09-13 16:28:20 · 1632 阅读 · 0 评论 -
计算机视觉的应用13-基于SSD模型的城市道路积水识别的应用项目,辅助城市交通管理
大家好,我是微学AI,今天给大家介绍一下基于SSD模型的城市道路积水识别项目。今年第11号台风“海葵”后部云团的影响,福州地区的降雨量突破了历史极值,多出地方存在严重的积水。城市道路积水是造成交通拥堵、车辆事故和城市排水系统过载的主要原因之一。因此,准确地识别城市道路上的积水情况对于城市交通管理和公共安全至关重要。本文基于SSD模型,提出了一种城市道路积水识别方法。原创 2023-09-06 16:32:58 · 1529 阅读 · 2 评论 -
计算机视觉的应用12-卷积神经网络中图像特征提取的可视化研究,让大家理解特征提取的全过程
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用12-卷积神经网络中图像特征提取的可视化研究,让大家理解特征提取的全过程。要理解卷积神经网络中图像特征提取的全过程,我们可以将其比喻为人脑对视觉信息的处理过程。就像我们看到一个物体时,大脑会通过不同的神经元来处理不同特征的信息,如轮廓、色彩和纹理等。原创 2023-08-31 11:50:48 · 2105 阅读 · 6 评论 -
深度学习实战50-构建ChatOCR项目:基于大语言模型的OCR识别问答系统实战
大家好,我是微学AI,今天给大家介绍一下深度学习实战50-构建ChatOCR项目:基于大语言模型的OCR识别问答系统实战,该项目是一个基于深度学习和大语言模型的OCR识别问答系统的实战项目。该项目旨在利用深度学习技术和先进的大语言模型,构建一个能够识别图像中文本,并能够回答与文本相关问题的系统。原创 2023-08-23 18:40:03 · 1801 阅读 · 1 评论 -
计算机视觉的应用11-基于pytorch框架的卷积神经网络与注意力机制对街道房屋号码的识别应用
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用11-基于pytorch框架的卷积神经网络与注意力机制对街道房屋号码的识别应用,本文我们借助PyTorch,快速构建和训练卷积神经网络(CNN)等模型,以实现街道房屋号码的准确识别。引入并注意力机制,它是一种模仿人类视觉注意机制的方法,在图像处理任务中具有广泛应用。通过引入注意力机制,模型可以自动关注图像中与房屋号码相关的区域,提高识别的准确性和鲁棒性。原创 2023-08-19 11:05:58 · 1219 阅读 · 0 评论 -
计算机视觉的应用10-图片中的表格结构识别与提取实战
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用10-图片中的表格结构识别与提取实战,表格结构识别在信息处理领域中具有广泛应用,但由于表格的多样性和复杂性,以及难以准确解析的布局和格式,传统的方法往往存在一定的局限性。本项目基于深度学习技术,通过训练神经网络模型,实现了高效准确的表格结构识别。本文将详细介绍该项目的研究背景、方法、实验结果以及应用前景。原创 2023-08-11 17:52:55 · 1826 阅读 · 2 评论 -
计算机视觉的应用9-视觉领域中的61个经典数据集【大集合】的应用与实战
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用9-视觉领域中的61个经典数据集【大集合】的应用与实战,我们都知道计算机视觉是一门研究如何使计算机能够理解和解释数字图像或视频的技术和方法。在计算机视觉领域中,数据集是非常重要的资源,它们可以用于训练和评估图像分类、目标检测、语义分割和其他计算机视觉任务的算法模型。原创 2023-08-09 21:29:07 · 1736 阅读 · 3 评论 -
计算机视觉的应用8-基于ResNet50对童年数码宝贝的识别与分类
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用8-基于ResNet50对童年数码宝贝的识别与分类,想必做完90后的大家都看过数码宝贝吧,里面有好多类型的数码宝贝,今天就给大家简单实现一下,他们的分类任务。原创 2023-06-18 19:00:31 · 2769 阅读 · 2 评论 -
计算机视觉的应用7-利用YOLOv5模型启动电脑摄像头进行目标检测
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用7-利用YOLOv5模型启动电脑摄像头进行目标检测,本文将详细介绍YOLOv5模型的原理,YOLOv5模型的结构,并展示如何利用电脑摄像头进行目标检测。文章将提供样例代码,以帮助读者更好地理解和实践YOLOv5模型。原创 2023-06-13 11:46:46 · 5971 阅读 · 8 评论 -
计算机视觉的应用6-利用VGG模型做毕加索风格图像迁移
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用5-利用VGG模型做毕加索风格图像迁移,本文将利用VGG模型实现毕加索风格图像迁移的方法。首先,我们将简要说明图像风格迁移的原理,然后使用PyTorch框架,分步骤地实现毕加索风格图像迁移的算法。最后,我们将展示实验结果,验证算法的有效性。原创 2023-05-22 18:01:30 · 2017 阅读 · 0 评论 -
计算机视觉的应用5-利用PCA降维方法实现简易人脸识别模型
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用5-利用PCA降维方法实现简易人脸识别模型,本文将介绍如何使用主成分分析(PCA)实现简易的人脸识别模型。首先,我们将简要介绍PCA的原理及其在人脸识别中的应用。接着,我们将通过实例演示如何使用Python实现PCA降维,并给出完整的代码示例。原创 2023-05-21 21:23:54 · 2121 阅读 · 2 评论 -
深度学习实战31-开发基于机器学习的在线图像识别工具
大家好,我是微学AI,今天给大家讲一下深度学习实战31-开发基于机器学习的在线图像识别工具,本文开发一个基于机器学习的在线图像识别工具,用户可以上传一张图片,并得到对应的标签或分类信息。该工具应该支持多种图像类型,例如自然风景、动物、物品等,并且在处理复杂图像时具有良好的准确性和鲁棒性。原创 2023-05-19 16:35:53 · 840 阅读 · 1 评论 -
计算机视觉的应用4-目标检测任务:利用Faster R-cnn+Resnet50+FPN模型对目标进行预测
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用4-目标检测任务,利用Faster Rcnn+Resnet50+FPN模型对目标进行预测,目标检测是计算机视觉三大任务中应用较为广泛的,Faster R-CNN 是一个著名的目标检测网络,其主要分为两个模块:Region Proposal Network (RPN) 和 Fast R-CNN。我将会详细介绍使用 ResNet50 作为基础网络并集成 FPN(Feature Pyramid Network)的 FasterRCNN 模型。这个模型可以写为原创 2023-05-05 11:17:48 · 5228 阅读 · 10 评论 -
计算机视觉的应用3-批量图片风格迁移之素描图片生成的应用
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用3-批量图片生成素描图片的应用,将一张图像转换为素描风格的图像的其实是模拟了人类视觉在观察物体时受到的光照条件。素描风格的图像在灰度值上表现出明暗交替的效果,这种效果是通过对原始图像进行梯度计算和光照调整的过程来实现的,本文使用两种方法实现。原创 2023-05-04 13:56:13 · 809 阅读 · 0 评论 -
深度学习实战23(进阶版)-语义分割实战,实现人物图像抠图的效果(计算机视觉)
大家好,我是微学AI,今天给大家带来深度学习实战23(进阶版)-语义分割实战,实现人物图像抠图的效果。语义分割是计算机视觉中的一项重要任务,其目标是将图像中的每个像素都分配一个语义类别标签。与传统的目标检测或分类任务不同,语义分割不仅需要识别图像中存在的对象以及它们的位置,还需要对每个像素进行精细的分类。原创 2023-04-07 18:36:45 · 2129 阅读 · 0 评论 -
深度学习实战22(进阶版)-AI漫画视频生成模型,做自己的漫画视频
AI生成视频是利用人工智能技术生成视频的过程,通常,这种技术基于图像识别、语音合成等算法,从各种不同来源的数据中获取信息,然后自动生成视频。imageio是Python中用于处理图像和视频的第三方库,其中的get_writer函数用于创建图像或视频的写入器(writer)对象。本项目里面采用原有视频转化为漫画视频,首先先将视频分割成一帧一帧的图片,然后将图片转化为漫画形式,在进行合成视频,这里运用imageio技术。,今天我借助这篇文章的原理做一个AI漫画视频生成的功能,让我们进入AI生成视频的时代吧。原创 2023-03-29 20:44:12 · 2546 阅读 · 7 评论 -
计算机视觉的应用2-以图搜图功能的实现,搭载可视化的搜索界面
以图搜图功能开发, 需要本地创建‘images‘的文件夹,把图片文件都放入文件夹中,然后程序中会创建图片的嵌入矩阵embeddings.pkl,我们加载embeddings.pkl进行图片搜索的相似度匹配,后面如果我需要添加图片到文件夹中,还需要将新的图片嵌入矩阵加入embeddings.pkl文件中,并进行查找。大家好,我是微学AI,今天给大家带来计算机视觉的应用2-以图搜图功能实现,以图搜图是一种网络图片搜索引擎技术,其主要功能是通过上传或输入一张图片,快速查找出相似或相同的图片或相关信息。原创 2023-03-25 13:08:38 · 2687 阅读 · 0 评论