![](https://img-blog.csdnimg.cn/702b052df4654145980b6d42bc3c1982.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
基于Tensorflow的计算机视觉
文章平均质量分 96
计算机视觉是一种技术,通过该技术,机器可以获得人类水平的可视化、处理和分析图像或视频的能力。本书将重点介绍使用 TensorFlow 开发和训练深度神经网络,以解决高级计算机视觉问题并在移动和边缘设备上部署解决方案。
Sonhhxg_柒
Save your heart for someone who cares. #愿岁月清净 抬头遇见皆是柔情#
展开
-
【CV】第 10 章:使用 R-CNN、SSD 和 R-FCN 进行目标检测
学习的一些关键概念包括如何使用 Google Cloud 评估对象检测器、如何使用labelImg创建注释文件、如何将 Google Drive 链接到 Google Colab 笔记本以读取文件、如何生成 TensorFlowtfRecord文件.xml和.jpg文件,如何开始训练过程并在训练期间监控读数,如何创建 TensorBoard 以观察训练准确性,如何在训练后保存模型,以及如何使用保存的模型进行推理。在本章中,我们将使用 R-FCN 训练我们的自定义模型,并将最终结果与其他模型进行比较。原创 2022-11-03 08:25:31 · 581 阅读 · 8 评论 -
【CV】第 9 章:使用多任务深度学习的动作识别
动作识别是计算机视觉的关键部分,涉及识别人的手、腿、头部和身体位置,以检测特定动作并将其分类为众所周知的类别。困难在于视觉输入的变化(例如身体凌乱或被衣服覆盖),类似的动作但不同的类别,例如喝水或使用手持手机交谈,以及获得有代表性的训练数据。本章详细概述了我们可用于人体姿态估计和动作识别的关键方法。动作识别结合了姿态估计方法和基于加速度的活动识别,以及基于视频和三维点云的动作识别。该理论将通过使用 TensorFlow 2.0 对其实现的解释来补充。本章分为四个部分。人体姿态估计——OpenPose。原创 2022-11-02 10:32:44 · 936 阅读 · 8 评论 -
【CV】第 8 章:语义分割和神经风格迁移
深度神经网络的应用不仅限于在图像中寻找对象(我们在前几章中已经了解)——它还可以用于将图像分割成空间区域,从而生成人造图像并从一个图像中转移风格图像到另一个。在本章中,我们将使用 TensorFlow Colab 来执行所有这些任务。语义分割预测图像的每个像素是否属于某个类别。这是一种有用的图像叠加技术。您将了解 TensorFlow DeepLab,以便您可以对图像执行语义分割。() 是强大的工具,用于生成人脸和手写数字等人工图像。它们也可用于图像修复。原创 2022-11-02 10:32:30 · 680 阅读 · 8 评论 -
【CV】第 7 章:使用 YOLO 进行对象检测
使用检测物体在上一章中,我们详细讨论了各种神经网络图像分类和对象检测架构,它们利用多个步骤进行对象检测、分类和边界框的细化。在本章中,我们将介绍两种单阶段的快速目标检测方法——You() 和 RetinaNet。我们将讨论每个模型的架构,然后使用 YOLO v3 在真实图像和视频中进行推理。我们将向您展示如何使用 YOLO v3 优化配置参数并训练您自己的自定义图像。YOLO概述我们在,神经网络架构和模型。原创 2022-11-01 10:55:31 · 1126 阅读 · 7 评论 -
【CV】第 6 章:使用迁移学习的视觉搜索
是从基础模型中提取特征向量,而无需在 ImageNet 数据集上训练顶层,然后添加我们自定义的全连接层,包括激活、丢弃和 softmax,以构成我们的最终模型。然后,我们学习了如何保持模型的基础层冻结,移除顶层,并用我们自己的顶层替换它,并用它训练生成的模型。我们的示例包含三种不同类别的家具——我们了解模型的准确性以及如何改善由此产生的损失。我们可以这样做的原因是,每个模型都使用具有 1,000 个类别的 ImageNet 数据库进行训练,并且模型的结果权重可供计算机视觉社区使用,以供其他人使用。原创 2022-11-01 08:34:02 · 514 阅读 · 7 评论 -
【CV】第 5 章:神经网络架构和模型
() 是计算机视觉中用于分类和检测对象的最广泛使用的工具。CNN 通过堆叠许多不同的线性和非线性函数层将输入图像映射到输出类或边界框。线性函数由卷积层、池化层、全连接层和 softmax 层组成,而非线性层是激活函数。神经网络有许多不同的参数和权重因子,需要针对给定的问题集进行优化。随机梯度下降和反向传播是训练神经网络的两种方式。在“图像深度学习”中,您学习了一些基本的编码技能来构建和训练神经网络,并了解了神经网络不同层内特征图的视觉转换。原创 2022-10-31 10:54:07 · 659 阅读 · 7 评论 -
【CV】第 4 章:图像深度学习
计算机视觉和 TensorFlow 基础”中介绍了边缘检测的概念。在本章中,您将了解如何使用边缘检测在体积上创建卷积操作,以及不同的卷积参数,如滤波器大小、尺寸和操作类型(卷积与池化)如何影响卷积体积(宽度与深度)。本章将非常详细地概述神经网络如何看待图像以及它如何使用该可视化来对图像进行分类。您将从构建您的第一个神经网络开始,然后在图像通过不同层时对其进行可视化。然后,您将网络模型的准确性和可视化与 VGG 16 或 Inception 等高级网络进行比较。原创 2022-10-31 10:53:48 · 427 阅读 · 5 评论 -
【CV】第 1 章:计算机视觉和 TensorFlow 基础知识
上述代码导入了机器学习和计算机视觉工作所需的Python库,例如用于处理数组的 NumPy、用于 openCV 计算机视觉工作的 cv2、用于处理Python代码中的图像的 PIL 以及用于绘制结果的M atplotlib。但是,一阶导数法的问题是,根据输入函数的不同,最大值会发生变化,因此无法预先确定最大值的阈值。例如,大小为 的图像224 x 224可以表示为 rank 的张量4,128, 224, 224, 3其中128是神经网络的批大小,224是高度和宽度,3是颜色通道(R、G 和 B)。原创 2022-10-29 15:14:38 · 246 阅读 · 4 评论 -
【CV】第 3 章:使用 OpenCV 和 CNN 进行面部检测
3.接下来,我们初始化两个图像数组imgs和Y_train. 我们读取train_data数组以添加图像列的路径,并为coltrn.shape[0]循环中定义的 50 个图像文件中的每一个读取图像文件for,并将其附加到图像的数组中。Haar 级联分类器算法是基于人脸图像在人脸不同区域具有鲜明的强度特征的思想,例如,人脸的眼睛区域比眼睑底部和鼻子区域更暗比它旁边的两个面部区域更亮。在每次迭代中,弱分类器的权重会根据正样本(人脸)的数量和负样本(非人脸)的数量进行调整,以评估误分类项目的数量。原创 2022-10-30 10:22:10 · 1165 阅读 · 12 评论 -
【CV】第 2 章:使用本地二进制模式的内容识别
然而,当图像没有纹理时,LBP 并没有返回好的结果,我们学习了如何开发一个 RGB 颜色匹配模型来匹配彩色的无纹理图像,例如面部和基础颜色。在这里,我们可以看到,一般来说,基于有限的训练数据(11 个样本),LBP 的结果非常好,在考虑的 7 个测试样本中只有一个错误。要了解上图中的相关性是如何完成的,我们需要绘制 LBP 直方图并比较训练图像和测试图像之间的直方图。我们可以看到,对于每种面部颜色,匹配(如对角线上的最小值点所示)得到了一个合理的值,表明颜色匹配技术应该是面部颜色与基础颜色匹配的首选方法.原创 2022-10-29 17:49:35 · 1124 阅读 · 9 评论 -
【CV】第 1 章:计算机视觉和 TensorFlow 基础知识
上述代码导入了机器学习和计算机视觉工作所需的Python库,例如用于处理数组的 NumPy、用于 openCV 计算机视觉工作的 cv2、用于处理Python代码中的图像的 PIL 以及用于绘制结果的M atplotlib。但是,一阶导数法的问题是,根据输入函数的不同,最大值会发生变化,因此无法预先确定最大值的阈值。例如,大小为 的图像224 x 224可以表示为 rank 的张量4,128, 224, 224, 3其中128是神经网络的批大小,224是高度和宽度,3是颜色通道(R、G 和 B)。原创 2022-10-29 11:02:38 · 2386 阅读 · 8 评论