使用 PyTorch 的计算机视觉项目
文章平均质量分 96
本文介绍CV领域的各种流行方法,以揭开其神秘面纱。使用 PyTorch 框架,分阶段向您介绍CV的概念,从计算机视觉基本概念开始。还将深入研究深度学习领域,并解释如何为视觉相关任务开发模型。探索革命性的卷积神经网络的概念,以及 VGG、ResNet、YOLO、Inception、R-CNN 等架构。
Sonhhxg_柒
Save your heart for someone who cares. #愿岁月清净 抬头遇见皆是柔情#
展开
-
【CV with Pytorch】第 10 章 :计算机视觉的可解释人工智能
大多数机器学习和深度学习模型都缺乏解释和解释结果的方法。由于深度学习模型的动态特性和不断增加的最先进模型,当前的模型评估基于准确度分数。这使得机器学习和深度学习成为黑盒模型。这导致对应用模型缺乏信心,对生成的结果缺乏信任。有多个库可以帮助我们解释结构化数据模型,例如 SHAP 和 LIME。本章介绍计算机视觉模型输出。以下是近年来提出的一些用于计算机视觉的白盒算法:CAMGrad-CAMGrad-CAM++SmoothGRADRISE。原创 2023-02-17 11:21:07 · 709 阅读 · 6 评论 -
【CV with Pytorch】第 9 章 :视频分析
机器学习之旅从很久以前的结构化数据开始,一直到提取有意义的预测的过程。随着数据的增长,机器学习也开始探索其他数据类型。今天,可以处理的数据类型没有限制。从结构化数据开始,我们开始分析文本数据。我们开始理解文本并使用文本中的特征进行预测。然后我们也跳到图像。尽管这个过程有时具有挑战性,但由于 GPU 和 TPU 处理能力的进步,事情开始顺利进行。然后是音频处理。这涉及使用频率处理音频或将音频转换为文本,然后进行预测。所有这些概念的组合称为视频分析。那里可用的视频数据量是巨大的。原创 2023-02-16 15:11:59 · 1510 阅读 · 8 评论 -
【CV with Pytorch】第 8 章 :图像超分辨率
随着高分辨率图像捕获代理的出现,图像中捕获的信息是巨大的。技术已经从超高清转向 4K 和 8K 分辨率。如今,电影正在使用高分辨率帧;但是,在某些情况下,他们需要将低分辨率图像增强为高分辨率图像。想象这样一个场景,电影的主角正试图确定从一张超速行驶的汽车的照片中捕捉到的车牌。超分辨率现在可以帮助我们在不扭曲图像的情况下高度放大图像。该行业发生了一些有趣的进步,我们将通过一些例子来讨论这些进步。图像中的现有信息不能从最初存在的任何信息中增加。在计算机科学中,我们有“垃圾输入,垃圾输出”,这是一个类似的概念。原创 2023-02-15 13:37:59 · 802 阅读 · 8 评论 -
【CV with Pytorch】第 5 章 : 基于图像的搜索和推荐系统
为了留住和获得新客户,尤其是在电子商务领域,客户服务需要一流。已经有数以千计的电子商务平台,而且这个数字在未来只会增加。具有出色客户体验的平台将长期生存。问题是我们如何提供优质的客户服务?我们可以通过多种方式提升客户体验。让搜索引擎成为最先进的不仅会让客户满意,还会通过交叉销售增加销售额。有很多方法可以使用自然语言处理、深度学习等搜索引擎和推荐引擎。最新版本是图像处理。我们可以利用图像处理、深度学习和预训练模型的强大功能来创建基于图像的搜索和推荐系统,从而产生出色的结果。原创 2023-02-14 09:39:35 · 861 阅读 · 8 评论 -
【CV with Pytorch】第 7 章 :图像异常检测
机器学习的研究使我们进入了研究各种模式和行为的过程。它使我们能够构建可以研究封闭环境的模型。预测能力通常遵循模型训练过程。这是我们在训练模型时需要经常问的一个重要问题。还有另一个问题需要回答——多少数据足以帮助模型理解分布,以便我们有一个好的表示?本章将针对这些重要问题给出示例和概念。我们正在讨论计算机视觉中的异常检测。我们有一个学习数据分布的机器学习模型,并最终可用于对未知数据集进行预测。学习过程仅限于我们用于训练的数据所代表的分布。训练过程完成后,少数样本可能会与大多数行为相矛盾。原创 2023-02-15 13:37:44 · 4252 阅读 · 9 评论 -
【CV with Pytorch】第 6 章 :姿态估计
构建自定义函数来绘制预测的关键点和身体骨架(通过连接关键点)。# 绘制输入图像的关键点和骨架的函数# 从彩虹光谱中初始化一组颜色\# 创建图像的副本# 从光谱中选择一组 N 个颜色 ID# 对检测到的每个人进行迭代# 检查检测到的人的置信度分数# 抓取检测到的人的关键点位置# 获取关键点的关键点分数# 迭代每个关键点分数# 检查检测到的关键点的置信度分数# 将关键点浮点数组转换为 python 整数列表# 在指定的 color-id 处选择颜色# 在关键点位置画一个圆圈。原创 2023-02-14 09:39:57 · 3185 阅读 · 9 评论 -
【CV with Pytorch】第 4 章 :构建图像分割模型
我们周围的图像有不同的纹理、图案、形状和大小。它们携带着大量的信息,这些信息很容易被人眼和大脑理解,但计算机却不太容易理解。图像分割是一个问题集,我们试图训练计算机理解图像,以便它们可以分离不同的对象并将相似的对象分组。这可以是类似像素强度或类似纹理和形状的形式。已经开发了许多算法并已用于分割图像。就像对象检测将对象分开一样,图像分割从不太相似的对象中识别出更多相似的对象。如果我们考虑基本聚类方法(例如 k-means)中使用的概念,我们就会知道数据点如何在相似数据附近对齐。原创 2023-02-14 09:42:54 · 1605 阅读 · 10 评论 -
【CV with Pytorch】第 3 章 : 构建目标检测模型
目标检测是当今最抢手的技能之一。一个图像可以有多个类。此外,对对象进行分类只能解决部分问题。另一部分在于对象的定位。对象检测有助于识别带有边界框的图像的类别位置。可以针对各种子任务进一步处理边界框。例如,想一想交通摄像头需要什么来检测和识别汽车。交通摄像头需要检测汽车和车牌,然后从车牌上读取号码以识别车主。这不是一个简单的问题。我们需要带注释的注册数据。一个简单的分类卷积神经网络模型是行不通的。我们需要获取车牌的边界框并搜索字母数字字符,使用一系列数据清理、去噪和超分辨率步骤。原创 2023-02-13 11:41:12 · 779 阅读 · 8 评论 -
【CV with Pytorch】第 2 章 :图像分类
我们将检查肺部的 X 射线图像,并在计算机视觉建模技术的帮助下将它们分类为患有肺炎或正常。由于这是一个医疗保健问题,因此最好让模型过度预测。我们需要以最高形式的准确度进行预测,并且如果可能的话应该有接近 100% 的召回率,以及高精度得分。我们需要确保诊断出任何可能的感染病例,而不是因为边缘小而将受感染的肺部错误分类为健康。Softmax logits 通常可用于确定预测而不是 softmax 函数决定类别。这是一个基于数据经验和模型行为的关键决策。原创 2023-02-13 11:15:33 · 682 阅读 · 10 评论 -
【CV with Pytorch】第 1 章 : 计算机视觉的基石
计算机视觉处理依赖于图像和视频的特定问题集。它试图破译图像/视频中的信息,以便做出有意义的决定。就像人类解析一幅图像或一系列按顺序放置的图像并对其做出决策一样,CV 帮助机器解释和理解视觉数据。这包括对象检测、图像分类、图像恢复、场景到文本生成、超分辨率、视频分析和图像跟踪。这些问题中的每一个都以其自身的方式很重要。在并行计算的力量发挥作用后,研究与视觉相关的问题获得了很大的吸引力。深度学习建模需要高计算量和正确定义的优化框架。有一些现有框架在研究和开发人员社区中非常受欢迎。原创 2023-02-12 21:48:48 · 802 阅读 · 10 评论