自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

深度学习与计算机视觉

机器学习 深度学习 计算机视觉 Python 目标检测 语义分割 OpenCV中文教程

  • 博客(1090)
  • 收藏
  • 关注

原创 C++ 和机器学习:使用 C++ 执行 ML 任务的简介

C++ 和机器学习:使用 C++ 执行 ML 任务的简介介绍C++ 是一种高性能编程语言,非常适合机器学习( ML ) 任务。尽管它在 ML 中可能不像 Python 或 R 那样流行,但它在速度和内存效率方面具有优势。在本文中,我们将概述使用 C++ 执行 ML 任务。C++ 中的 ML 库C++ 中有几个用于机器学习的库,包括:TensorFlow:TensorFlow 是由 Google 开...

2023-05-30 21:39:15 183

转载 使用 OpenCV 的 SIFT 图像特征提取和匹配

简介:图像特征提取和匹配是计算机视觉和图像处理中的重要任务。它们在图像识别、目标检测和图像拼接等各种应用中发挥着至关重要的作用。一种流行的特征提取算法是尺度不变特征变换 (SIFT),它被广泛用于检测和描述对尺度、旋转和光照变化不变的稳健特征的能力。在本文中,我们将探讨如何将 SIFT 与流行的开源计算机视觉库 OpenCV 一起用于图像特征提取和匹配。输入图像:让我们首先加载要在其上执行特征提取...

2023-05-24 20:42:05 15

转载 即刻体验!对话超1亿次!「ChatGPT国内平替版」爆火!速度快准确率高!

【导读】近期,ChatGPT国内平替换版开放猫平台(openmao.panchuang.net)V 2.0版本正式上线了,在V1.0的基础上增加了按账号保存聊天记录、复制、重新生成回答等功能。聊天速度和回复的准确性也更佳!从2月份上线以来,总对话次数已过亿,堪称ChatGPT国内强大平替版!据视觉君了解,开放猫平台是在ChatGPT和其它大模型基础上二次开发的,包括敏感词的过滤、prompt、本地...

2023-05-22 19:20:59 67

转载 经常关注学习的几个原创人工智能公众号

最近chatgpt大火,多个领域的人员开始担心自己有可能被chatgpt代替,其中包括人工智能领域。笔者认为,如果算法基础比较扎实,对于新的技术,不仅掌握的快而且在当前的技术上进行二次开发定制,让人工智能算法更适合自己所从事的应用场景。今天给大家推荐的是专注原创和热点的10个公众号,希望能让你更高效的学习。AI有道一个值得关注的 AI 技术的公众号。作者红色石头是专注于人工智能的 CSDN 博客专...

2023-05-21 23:45:57 18

原创 使用OpenCV进行肺炎诊断检测

肺炎是一种由感染引起的严重呼吸道疾病,特别是在高危人群中,可能会出现危及生命的并发症。必须尽快诊断和治疗肺炎,以最大限度地提高患者康复的机会。诊断过程并不容易,需要一些医学实验室工具和先进的医疗技能,但我们可以使用深度学习和计算机视觉来构建一个快速简便的工具,帮助医生检测肺炎。我们可以使用称为OpenCV(https://opencv.org/)(开源计算机视觉)的开源计算机视觉和机器学习软件库创...

2023-05-20 23:50:23 281

原创 在 Python 中使用 OpenCV 构建 Color Catcher 游戏

介绍你是否曾经想在 Python 中使用 OpenCV 创建自己的游戏?今天我们将构建一个名为 Color Catcher 的游戏,该游戏挑战玩家使用手部跟踪机制接住从屏幕顶部掉落的彩球。设置游戏窗口构建游戏的第一步是使用 OpenCV 设置游戏窗口。我们将定义窗口大小、创建窗口并设置其在屏幕上的位置:#Setupthegamewindowwindow_size=(640,480...

2023-05-18 18:00:58 215

原创 使用 CNN 进行面部情绪识别

面部表情是人类之间交流的重要方式。在人工智能研究中,深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。本研究旨在开发一种能够使用卷积神经网络(CNN)算法和特征提取技术预测和分类面部情绪的系统。该过程包括三个主要阶段:数据预处理、面部特征提取和面部情绪分类。通过采用卷积神经网络(CNN)算法,系统准确预测面部表情,成功率为62.66%。该...

2023-05-17 23:58:56 174

原创 时尚达人的深度学习:非洲服装检测

介绍时尚在医疗、教育和农业等不同领域的人工智能领域并没有受到太多关注,包括机器学习、深度学习。这是因为时尚不被认为是一个关键领域.时尚和文化在 AI 中并没有得到公正的对待。这是一个令人兴奋的项目,我们将在 8 种当地非洲服装之间建立一个分类器模型!这不是一个常规项目,因为数据集是新的,并与此项目一起启动。请将此视为一个原创项目,为你的数据科学简历增添更多美感。检测非洲服装可以被认为是一个有趣的项...

2023-05-16 23:42:45 99

原创 默认的HuggingFace模型

介绍在本文中,我将探讨表征学习中常见的一种做法——使用预训练神经网络的冻结状态作为学习特征提取器。具体而言,我感兴趣的是研究使用这些提取的神经网络特征训练的简单模型的性能与使用迁移学习初始化的微调神经网络的性能的比较。预期受众主要是数据科学家,以及对计算机视觉和机器学习感兴趣的任何人。稍微跳过一点......下面的结果表明,使用提取的神经网络特征训练的 scikit-learn 模型的表现几乎与使...

2023-05-12 19:32:26 212

原创 在OpenCV中使用Canny边缘检测

边缘检测是非常常见和广泛使用的图像处理,对于许多不同的计算机视觉应用非常必要,如数据提取,图像分割,在更细粒度的特征提取和模式识别中。它降低了图像中的噪声和细节数量,但保留了图像的结构。Python中的Canny边缘检测是计算机视觉中最流行的边缘检测方法之一。以下是Canny边缘检测的步骤:1.使用高斯平滑来减少噪声2.计算梯度3.应用非极大值抑制以减少噪声4.找到上下阈值5.应用阈值。幸运的是,...

2023-05-11 23:27:53 325

原创 使用图像数据进行特征工程

通过特征工程,我们立即想到的是表格数据。然而,我们也可以为图像数据获取特征。目标是提取图像的最重要方面。这样做将使我们更容易找到数据和目标变量之间的映射。这意味着你可以使用更少的数据和更小的模型进行训练。较小的模型可以减少进行预测所需的时间。当部署在边缘设备上时,这是特别有用的。另一个好处是,你可以更确定你的模型用于进行预测的内容。我们将使用Python通过一些图像特征工程的方法来演示这一点:裁剪...

2023-05-09 23:26:44 27

原创 CLIP:创建图像分类器

介绍假设需要对人们是否戴眼镜进行分类,但是没有数据或资源训练自定义模型。在本教程中,你将学习如何使用预训练的CLIP模型创建自定义分类器,无需任何训练。这种方法称为零快照图像分类,它使得能够对在原始CLIP模型训练期间未明确观察到的的类进行图像分类。为了方便起见,下面提供了一个易于使用的jupyter笔记本,并提供完整的代码。CLIP:理论背景CLIP (对比语言-图像预训练)模型是OpenAI开...

2023-05-07 19:35:03 56

原创 车位数量检测

该项目基于图像处理来检测停车场中的空间。该项目将使用 openCV 和 CVzone 库来执行图像处理任务。如何运行用鼠标单击功能在停车场的静止图像上绘制框在这些单独的框上裁剪和执行 opencv 转换结合这两个步骤并将它们应用于视频以检查可用的可用空间过程1. 安装和导入依赖项openCV 将允许我们导入图像和视频,然后我们可以对它们应用转换,CVzone作为基于 openCV 的库,它还允许...

2023-05-04 23:16:41 34

原创 使用 YOLOv3 和 COCO 数据集掌握对象检测

在这篇博文中,将针对具有 80 个标签的 coco 数据集逐行解释 Yolov3 预训练对象检测的代码说明。我们可以从 yolo 官网获取 weights 文件和 cfg 文件:https://pjreddie.com/darknet/yolo/image=cv2.imread('./testingimages/crosswalk-featured.jpg')#cv2.imshow('im...

2023-05-02 20:41:57 40

转载 chatgpt大火,这些公众号你关注了吗

最近chatgpt大火,多个领域的人员开始担心自己有可能被chatgpt代替,其中包括人工智能领域。笔者认为,如果算法基础比较扎实,对于新的技术,不仅掌握的快而且在当前的技术上进行二次开发定制,让人工智能算法更适合自己所从事的应用场景。今天给大家推荐的是专注原创和热点的10个公众号,希望能让你更高效的学习。机器学习算法那些事一个百度人的技术提升之路,为您提供一系列计算机视觉,自然语言处理和推荐系统...

2023-05-02 20:41:57 81

原创 Mediapipe Tasks API 及其在项目中的实现

介绍深度学习使机器能够从大量数据中学习和改进,从而彻底改变了人工智能领域。Mediapipe 是一个用于构建多模式 ML 管道的跨平台开源框架,它引入了一个新的任务 API,可以比以往更轻松地将深度学习模型整合到你的项目中。本文将探索三个使用 Mediapipe Tasks API 的激动人心的项目,这些项目专注于一个单独的领域:音频、图像和文本。通过这些示例,你将学习如何应用深度学习来解决现实世...

2023-04-30 18:01:24 68

转载 标注神器 | Label-Studio X SAM 半自动化标注

本文将介绍结合 Label-Studio 和 SAM (Segment Anything) 半自动化标注方案,Point2Lablel:用户只需要在物体的区域内点一个点就能得到物体的掩码和边界框标注,Bbox2Label:用户只需要标注物体的边界框就能生成物体的掩码,社区的用户可以借鉴此方法,提高数据标注的效率。SAM (Segment Anything) 是 Meta AI 推出的分割一切的模型...

2023-04-29 18:01:26 326

原创 使用 MMDETECTION 和 LABEL-STUDIO 进行半自动化目标检测标注

标注数据是一个费时费力的任务,本文介绍了如何使用 MMDetection 中的 RTMDet 算法联合 Label-Studio 软件进行半自动化标注。具体来说,使用 RTMDet 预测图片生成标注,然后使用 Label-Studio 进行微调标注,社区用户可以参考此流程和方法,将其应用到其他领域。RTMDet:RTMDet 是 OpenMMLab 自研的高精度单阶段的目标检测算法,开源于 MMD...

2023-04-27 23:52:38 156 2

原创 Python — 将非方形图像转换为方形图像

使用 CV2 在 Python 中以编程方式完成如下操作:将非方形图像转换为方形图像因此,6 年来,我第一次将一些图片上传到 Instagram。我画了一些愚蠢的漫画,想上传它来娱乐一下。然而,问题:我有 10 张图片要上传每个图像都有不同的尺寸Instagram 会自动将你的图像 (ew) 裁剪为方形4:5 纵横比9:16 纵横比所以我需要一种方法来为我的图像添加白色填充,使它们都是正方形。以下...

2023-04-26 23:13:07 26

原创 使用 TensorFlow 进行图像分割的深度学习

介绍图像分割是计算机视觉中的一项任务,涉及将特定图像划分为多个片段,其中每个片段代表图像中的对象或区域。这项任务对于对象检测、图像识别和自动驾驶等应用非常重要。TensorFlow 是一个开源框架,用于构建和训练机器学习模型,在我们的例子中是图像分割模型。Tensorflow 提供执行图像分割任务所需的工具和预训练模型。图像分割有一些现实世界的用例。他们包括:对象识别和跟踪:图像分割用于实时跟踪和...

2023-04-23 21:51:38 115

原创 入门:使用 OpenCV 进行图像处理

介绍图像处理是计算机视觉的一个分支,它使用各种算法来处理和分析数字图像。它涉及使用数学或统计操作来为许多应用修改图像,包括但不限于医学和卫星图像以及数字摄影。本文探讨了图像处理的基础知识和该领域中使用的一些技术。目录图像处理基础图像处理的应用图像预处理技术应用一些技巧结论图像处理基础数字图像由像素组成,像素是代表图像中该点的颜色和亮度值的小方框。图像处理涉及以所需方式处理这些像素,以实现图像所需的...

2023-04-22 21:31:44 48

原创 在 Ubuntu 中使用从源代码编译的 FFmpeg 5 编译 Opencv 4.7.0

准备好使用自定义 FFmpeg 视频 I/O 后端来增强你的 OpenCV,本教程将进行详细说明。在OpenCV 4.7版本的发布说明中,提到了对FFmpeg 5.x的支持改进。因此,让我们首先从源代码编译FFmpeg 5.x,然后从源代码编译OpenCV 4.7并链接此自定义FFmpeg库。让我们开始吧!顺便说一下,我将在运行在WSL 2下的Ubuntu 22中进行操作。上次我使用Opencv ...

2023-04-20 19:43:07 56

原创 在 Xcode 中将 OpenCV 集成到你的 Swift iOS 项目中并使用 UIImages

假设在你的 iOS 应用程序中,你想对图像执行抓取或使用特定插值调整图像大小,作为机器学习模型的预处理步骤。你无法在 Xcode 上使用 Apple 的原生框架(例如 Core Image)轻易地做到这一点。如果你想坚持使用 Apple 的工具,你可能不得不使用Metal,并且仍然需要从头开始编写代码。或者,你可以将 OpenCV 与你的 Xcode swift 项目集成,并使用 100 多种现成...

2023-04-18 19:57:02 80

原创 学习如何使用 Python 将你的照片变成卡通版本

本文将介绍使用 Python 将普通图像转换为卡通版的各种方法。我们将使用 Python 库和包,例如OpenCV、Pillow、scikit-image和matplotlib。以下是该过程的基本概要:导入必要的包。使用我们正在使用的三个库之一加载图像(OpenCV,Pillow 或scikit-image)。将图像转换为灰度。获取图像的边缘。将图像转换为卡通版本。使用matplotlib.pyp...

2023-04-17 18:01:28 122

原创 手势控制的机器人手臂

将向你展示如何构建机械手臂并使用手势和计算机视觉来控制它。下面有一个在开发阶段的机械手臂的演示视频。展示开发中的手臂的演示视频:https://youtu.be/KwiwetZGv0s如图所示,该过程首先用摄像头捕捉我的手及其标志。通过跟踪特定的界标,例如拇指和食指的指尖,可以确定这些界标的相对运动,并将其转化为伺服系统的运动。这是通过处理数据并将整数值发送到控制伺服电机的 Arduino 的 P...

2023-04-16 21:36:04 334

原创 Transformer

目录1.引言2.快速回顾注意力3.Transformer架构3.1.编码器和解码器组件3.1.1.编码器3.1.2解码器3.2.Transformer中的模块3.3.注意模块3.3.1.缩放点积注意事项3.3.2多头注意3.4.Transformer中的注意事项3.4.1.自注意3.4.2自回归或因果注意3.4.3.交叉注意3.5.FFN3.6.残差连接和归一化3.7.位置编码3.7.1.绝对位置...

2023-04-15 18:01:21 55

原创 计算机视觉与物体检测

第一次通过Tensorflow对象检测API了解对象检测。它很容易使用。传入了一张海滩的图片,作为回报,API在它识别的对象上绘制了方框。这似乎很神奇。很好奇,想剖析API,了解它到底是如何在幕后工作的。这很难,我失败了。Tensorflow对象检测API支持经过数十年研究的最先进模型。它们被复杂地编织成代码,就像钟表匠如何将微小的齿轮组合在一起,它们可以连贯地移动。然而,目前大多数最先进的模型都...

2023-04-14 18:38:07 64

原创 使用Flux.jl进行图像分类

在PyTorch从事一个项目,这个项目创建一个深度学习模型,可以检测未知物种的疾病。最近,决定在Julia中重建这个项目,并将其用作学习Flux.jl[1]的练习,这是Julia最流行的深度学习包(至少在GitHub上按星级排名)。但在这样做的过程中,遇到了一些挑战,这些挑战在网上或文档中找不到好的例子。因此,决定写这篇文章,作为其他任何想在Flux做类似事情的人的参考资料。这是给谁的?因为Flu...

2023-04-12 22:39:05 40

转载 科研论文写作路径+实践(经验篇)

一项科研工作,只有在文章发表后,才算告一段落。对于研究生及科研工作者来说,在科研论文的写作过程中,会遇到不少困难。这次我邀请了,除了从事科研,还担任过顶会审稿人的John老师给大家讲一下科研论文写作。所以本文将从一个审稿者的角度,从科研文章中如何选题、如何获得好的idea、如何写出好的论文三个方面展开谈谈,希望对大家有所启发。0.01元预约《科研论文写作直播》加课程老师领课程原件和进写作交流群直播...

2023-04-10 18:01:29 37

原创 使用Detectron2和FiftyOne训练物体探测器

近年来,机器学习(ML)生命周期的每一个方面都开发了工具,以使定制模型更容易从想法变成现实。最令人兴奋的是,社区倾向于使用Pytorch和Tensorflow等开源工具,从而使模型开发过程更加透明和可复制。在这篇文章中,我们将介绍如何集成两个开源工具来处理ML项目的不同部分:FiftyOne和Detectron2。Detectron2是由Facebook AI Research开发的一个库,旨在让...

2023-04-10 18:01:29 52

原创 具有梯度下降的相机径向畸变补偿

消费级相机和镜头既便宜又普遍。不幸的是,与它们的工业同行不同,它们的设计目的并不是作为计算机视觉应用中精确测量的工具。在各种类型的失真中,影响低档相机和镜头的最明显的失真是径向畸变。径向畸变是场景中对象的视角与图像中该对象出现的像素之间的非线性。在光学中心附近,这种影响很难察觉,但当我们径向远离光学中心时,失真变得更加明显。通常,远离光学中心的像素看起来比应该的更接近中心。图像的角似乎被拉向中心。...

2023-04-09 22:55:26 25

原创 银行业深度学习:哥伦比亚比索纸币检测

介绍假钞很容易成为小型和大型企业的问题。当这些钞票不是真的时,能够识别这些钞票是非常重要的。对于日常与现金打交道的商务人士和个人而言,此过程可能非常耗时。这就需要通过自动化来实现这一目标。因此,我们认为有必要开发一种自动机器学习假钞检测模型,即使是非专业人士也可以使用它来检测这些钞票的真伪。本文介绍了一个实际项目,我们在该项目中开发了一个深度学习和图像分类在银行业中的应用的真实原型。目标是使用现实...

2023-04-05 19:01:04 41

原创 使用 SKimage 的图像预处理

介绍图像是视觉对象的二维表示,例如照片、绘画或素描。在数字成像中,图像存储为像素值数组,其中每个像素代表图像亮度和颜色的样本。每个像素的颜色可以由一个或多个通道表示,如传统彩色图像中的红色、绿色和蓝色 (RGB) 通道。在本文中,你将学习各种图像预处理技术。图像可以使用计算机算法进行处理,以改变它们的外观或提取信息。图像处理技术包括调整大小、裁剪、旋转、过滤和阈值化等操作。这些操作是对像素值执行的...

2023-04-04 16:54:56 97

原创 使用 Pytorch 的迁移学习进行快餐分类

介绍快餐分类已成为自动化送餐系统中的一项重要任务。随着快餐连锁店的发展以及对准确高效的食品识别系统的需求,机器学习变得流行起来。在这篇博客中,我们将探索使用 PyTorch 将迁移学习用于快餐分类。迁移学习是一种利用预训练模型用有限数据解决新任务的技术。我们将讨论如何微调用于快餐分类的预训练模型以及从该方法获得的结果。学习目标了解用于深度学习的 PyTorch如何在 PyTorch 中使用迁移学习...

2023-04-03 19:13:35 59

原创 使用 Mask RCNN 和 Yolov5 进行划痕检测

介绍本文的重点是检测汽车划痕,与针对不同类型产品的自主质量检测系统的开发同步。在停车场,这种检测为客户提供了他们的汽车安全的保证;此外,如果发生某些事情,检测系统将有助于对这种情况进行谨慎处理。我将这个问题作为一个单类分类问题来解决,将凹痕、损坏和划痕视为划痕,并进一步在 Flask 的帮助下制作了一个基本应用程序。我将向你介绍我在做这个项目时获得的所有想法、代码、算法和知识,我将通过Mask R...

2023-04-02 19:52:32 159

原创 探索 KITTI 数据集:自动驾驶汽车的视觉里程计

什么是 KITTI 数据集?KITTI 是由卡尔斯鲁厄理工学院和芝加哥丰田技术学院开发的自动驾驶数据集。它是计算机视觉研究中使用的图像和 LIDAR 数据的集合,例如立体视觉、光流、视觉里程计、3D 对象检测和 3D 跟踪。该数据集可在 http://www.cvlibs.net/datasets/kitti/ 免费下载。在本文中,我们将探讨 KITTI 里程计数据集的用法。KITTI 数据集是用...

2023-03-31 21:58:42 217

原创 使用 YOLO 进行自定义对象检测

我们知道我们可以专门检测一些对象。那么我们如何训练系统检测自定义对象呢?让我们一步一步来。1. 创建数据集机器是通过数据集学习的。数据集必须包含图像和标签。例如,让我的目标是创建一个检测坦克的系统。我准备了从网上下载的坦克图片。然后我们需要使用第三方工具对图像进行标记,例如;LabelImg、MakeSense 等。我们将在此示例中使用 MakeSense,可以在此处访问它:https://www...

2023-03-29 20:00:24 94

原创 使用 YOLO 进行目标检测:如何提取人物图像

YOLO(You Only Look Once)是一种流行的用于对象检测的开源神经网络模型。在这篇文章中,我们将解释如何使用 YOLO 提取一堆人(或至少一个人)的图像。首先,我们需要安装 YOLO 库和依赖项。为此,我们将使用 pip 包管理器并安装以下库:pipinstallnumpypipinstallopencv-pythonpipinstalltensorflowpip...

2023-03-28 20:43:05 216

原创 使用 Python 进行面部和眼睛检测

通过使用 OpenCV,你可以识别面部和眼睛等对象,并使用 Haar 级联算法实时跟踪它们。Haar Cascade 是一种分类器,用于检测其训练对象。我们将使用 Face cascade和 Eyes cascade。你可以使用 Google 查找你可能想要检测的各种 Haar Cascades。安装 OpenCVpipinstallopencv-python从照片中检测我假设你已经从上面的链...

2023-03-26 17:45:40 82

原创 使用 Python 和 OpenCV 进行图像聚类

importnumpyasnpimportcv2importmatplotlib.pyplotaspltimage=cv2.imread('../input/hillstation/hillstation.jpg')plt.imshow(image)#originalimage<matplotlib.image.AxesImageat0x7f8efaabf8...

2023-03-23 23:03:00 94

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除