2019/2/27

最新推荐文章于 2024-03-30 04:22:24 发布

爱码仕1024

最新推荐文章于 2024-03-30 04:22:24 发布

阅读量394

点赞数

分类专栏： computer vision 文章标签：日记

本文链接：https://blog.csdn.net/the_little_fairy___/article/details/87976792

版权

computer vision 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

今天解决的小问题

1.anaconda prompt 找不到了：
解决办法：打开终端，跳转到Anaconda的安装目录，输入 python .\Lib_nsis.py mkmenus 完美解决
2、关于将了二维像素叠加成为三维的方法，https://blog.csdn.net/u013044310/article/details/80407220

计算机视觉学习部分

计算机视觉管道
1、输入一张原图像
2、图片预处理
3、选择感兴趣的部分，比如嘴唇的弧度，收集相关的特征数据
4、将特征数据输入到train model中
5、根据判断出来的情感行动。

标准化数据

预处理图像主要是标准化输入图像，以便进一步执行管道步骤，并以相同的方式分析图像。在机器学习任务中，预处理步骤通常是最重要的步骤之一。
如果图像具有不同的大小，甚至是按不同方式裁剪的，则这种计数技巧可能会失败！因此，在将这些图像传入管道之前，务必预处理它们，以便标准化它们。在下面的示例中，可以看出图像被预处理成了标准的正方形尺寸。
在这里插入图片描述

4、训练神经网络

要训练计算机视觉神经网络，我们通常会提供一系列有标签图像，然后将这些图像与预测输出标签或识别测量结果进行比较。然后，神经网络会监测是否出现任何误差（通过比较正确标签和输出标签），并通过修正从图像数据中查找和优先对待某些规律和差别的方式更正误差。最后，给定足够有标签数据的话，模型应该能够分类看到的任何新的无标签图像数据！
下图是一个训练流程。这是一个卷积神经网络，它会学习识别并区分微笑和傻笑图像。

这是非常概述性的神经网络训练流程，我们将在这门课程的后续阶段深入了解背后原理，使你能够很快开始编写计算机视觉应用！
在这里插入图片描述

梯度下降是最小化神经网络误差的数学方法。关于此最小化方法的更多信息请参阅此处。

卷积神经网络是一种神经网络类型，通常用于计算机视觉应用。它们学习识别一组给定图像中的规律。如果你想了解详情，请参阅此资源，我们将在这门课程的不同部分学习这种类型的神经网络，以及它们的详细工作原理！

5、划分数据

机器学习和神经网络

当我们提到图像分类和模式识别中使用的机器学习和神经网络时，我们说的是能够学习识别数据中的模式并对它们分组的一组算法。

我们之前介绍的示例是将脸部表情划分为两个类别：微笑或傻笑。神经网络或许能够学习根据不同的特性划分这些表情；神经网络能够有效地根据独特形状（对于微笑和傻笑来说，根据眼睛和嘴部的不同形状）画一条分隔两种数据的线条。_深度_神经网络很相似，只是它们能够绘制更多、更复杂的分隔线。深度神经网络会相互堆叠分隔层级，以对复杂的数据分组。

划分数据

假设你想划分两类图像数据：自行车图像和汽车图像。你会查看每个图像的颜色和其中车辆的明显大小，然后在图形上绘制数据。对于以下点（粉点是自行车，蓝点是汽车），如何选择划分这些数据？
在这里插入图片描述

划分层级

如果数据看起来这样呢？

在这里插入图片描述

7、图像形成

图片是3D场景的2D显示，比如说有一个苹果，那么这个苹果有如下的表示
在这里插入图片描述

8、作为网格像素的图像

认识灰阶图

在这里插入图片描述数字表示：左上角表示原点

在这里插入图片描述编写程序：
作为数字数据的图像

图像中的每个像素只是一个数值，我们也可以改变这些像素值。可以用一个像素值乘以一个标量来改变图像的亮度，我们可以将每个像素值向右移动，还有更多的操作！

将图像作为数字网格处理是许多图像处理技术的基础。

大多数颜色和形状转换只是通过对图像进行数学运算，并逐个像素进行改变来完成的。

10、彩色图像

你刚刚看到的例子中，这张图像被分解为具有宽度和高度的灰度像素值的二维网格，但是彩色图像有点不同。彩色图像被解释为具有宽度、高度和深度的 3D 立方体值！

深度是颜色的数量。大多数彩色图像可以由 3 种颜色的组合来表示：红色、绿色和蓝色值；这些被称为 RGB 图像。对于 RGB 图像而言，其深度为 3。

我们可以将深度视为三个堆叠的2D 颜色层。这三层分别是红色、绿色和蓝色。它们组合在一起构建出了一幅完整的彩色图像。
在这里插入图片描述颜色的重要性

一般来说，当你想进行分类挑战时，例如识别车道线、汽车或是行人，你可以通过自己的视觉来确定颜色信息和彩色图像是否有用。

既然识别颜色对于人类来说更加容易，那么让算法识别彩色图像也可能更加容易！

13、颜色阈值

当我们将图片看成是一个一个的像素点之后，该如何应用这些信息呢？？
常用的地方是绿幕以及蓝幕，可以用来更换视频流的背景。
使用图像的颜色信息来分离感兴趣的区域，俗称抠图换背景。

编写蓝色屏幕：

OpenCV
OpenCV 是一个热门的计算机视觉库，具有很多用于图像分析和理解的内置工具！

为何要使用 BGR，而不是 RGB？
OpenCV 会读取 BGR 格式（而不是 RGB 格式）的图像，因为一开始开发 OpenCV 的时候，BGR 颜色格式对相机制造商和图像软件提供商来说很受欢迎。红色通道被认为是最不重要的颜色通道，因此列在最后面。但是，现在标准改变了，很多图像软件和相机都使用 RGB 格式，因此在这些示例中，建议先将 BGR 图像转换为 RGB 图像，然后再分析或操纵图像。
更改颜色空间

要更改颜色空间，我们使用 OpenCV 的 cvtColor 函数，其文档请参阅此处。

爱码仕1024

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2019/2/27

今天解决的小问题1.anaconda prompt 找不到了：解决办法：打开终端，跳转到Anaconda的安装目录，输入 python .\Lib_nsis.py mkmenus 完美解决2、关于将了二维像素叠加成为三维的方法，https://blog.csdn.net/u013044310/article/details/80407220计算机视觉学习部分计算机视觉管道1、输入一张...
复制链接

扫一扫