初识神经网络

最新推荐文章于 2024-07-13 14:27:17 发布

X也总

最新推荐文章于 2024-07-13 14:27:17 发布

阅读量614

点赞数

分类专栏：深度学习文章标签：神经网络深度学习人工智能算法

本文链接：https://blog.csdn.net/qq_52642385/article/details/125565032

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、概论

机器学习其复杂之处便是如何进行特征工程来提取特征，但是对于深度学习而言，其优势便是解决了特征工程复杂的问题，从而可以让计算机可以自己提取特征，拥有学习的能力

常用于自然语言处理和计算机视觉，人脸识别

但是其不太适用于移动端，因为其内部参数实在是太多了，速度可能比较慢，但是对于准确率比传统机器学习模型高

深度学习支持的数据集比较大的时候效果较传统的人工智能算法要好，图像数据集可以通过旋转，映像等方式扩充。

二、计算机视觉基础知识

1.二值图像

二值图像是指仅仅包含黑色和白色两种颜色的图像，在计算机中以二维矩阵表示，其中白色为1，黑色为0，例如96*96的二值图像即可表示为矩阵为96*96的二维矩阵

2.灰度图像

同样，灰度图像仍为二维矩阵表示，但其值不再是0，1。通常,计算机会将灰度处理为 256 个灰度级,用数值区间[0,255] 来表示。其中,数值"255"表示纯白色,数值“0”表示纯黑色,其余的数值表示从纯白到纯黑之间不同级别的灰度用于表示 256 个灰度级的数值 0-255,正好可以用一个字节(8 位二进制值)来表示。

3.彩色图像

神经生理学实验发现,在视网膜上存在三种不同的颜色感受器,能够感受三种不同的颜色红色、绿色和蓝色,即三基色。自然界中常见的各种色光都可以通过将三基色按照一定的比例混合构成。除此以外,从光学角度出发,可以将颜色解析为主波长,纯度,明度等,从心理学和视觉角度出发,可以将颜色解析为色调、饱和度、亮度等,通常,我们将上述采用不同的方式表述颜色的模式称为色彩空间,或者颜色空间、颜色模式等。

虽然不同的色彩空间具有不同的表示方式,但是各种色彩空间之间可以根据需要按照公式进行转换。这里仅仅介绍较为常用的 RGB 色彩空间

在 RGB 色彩空间中,存在 R(red,红色)通道,G(gren,绿色)通道和 B(bhue,踅色)通道,共三个通道。每个色彩通道值的范围都在 [0-255] 之间,我们用这三个色彩通道的组合表示颜色。
以比较通俗的方式来解释就是,有三个油漆桶,分别装了红色、绿色、蓝色的油漆,我们分别从每个油漆桶中取容呈为 0-255 个单位的不等量的油漆,将三种油漆混合就可以调出一种新的色,三种油漆经过不同的组合,共可以词配出所有常见的 256×256×256=16777216种颜色

因此我们可以用三维矩阵来表示彩色图像，一般清况下,在 RGB 色彩空间中,图像道的顺序是 R→G→B,即第1 个通道是R通道，第2 个通道是G通道,第3 个道是B 通道: 需要特别注意的是,在 Opencv中,通道的顺序是 B→G→R。