深度学习笔记20235018-CSDN博客

本文链接：https://blog.csdn.net/qq_52750257/article/details/130742148

使用深度神经网络（几十层、几百层的神经网络）从大规模数据中学习的过程就是深度学习。
将输入的数据的异同点进行提取并且层层抽象，记录在神经网络的参数里就训练出来一个可以区分这些物体的深度神经网络。
“面向机器的知识图谱”，是一个关联的知识网络，举一反三、拓展延伸，有了大规模的知识图谱，机器可以融合学习，类似于人类一代一代的知识传承，机器的学习效率和效果会有很大提升，这个过程就是知识增强。
深度学习框架：百度飞桨、谷歌TensorFlow、脸书创始人扎克伯格的元宇宙产业Meta的PyTorch。
应该把神经网络当作一种特征提取的方法。“特征”是非常重要的，什么样的特征/数据能拿来学习非常重要。
机器学习的流程：数据获取、特征工程、建立模型、评估与应用。特征工程是最核心的部分。深度学习解决了机器学习中“人工”方面的问题，因为深度学习可以自动学习特征，怎么样组合比较合适，这些内容在机器学习中都是交给“人”来实现的。
数据特征决定了模型的上限，因此数据预处理和特征提取是最核心的，算法与参数的选择决定了如何去逼近这个上限。
特征如何提取？深度学习可以自动完成。
深度学习的最大核心在于在计算机视觉（即输入数据是图像数据，然后做建模）和自然语言处理（文本数据做建模）方面做文章。
深度学习最大的问题：在移动端支持不好，因为计算量太大，有成百上千万的参数，正是赖以提取特征的依据。移动端速度会变慢。
现在比较火的是医学＋深度学习。
图片看起来不同是因为像素点上的额值不一样，“变脸”就是深度学习将像素点上的值改变一下。还有老照片修复也是同样的道理。
IMGENET是一个较早的图像数据集。12年深度学习逐渐走进大家的视野，成为新的蓝海。
数据规模越大越好，数据集上万上百万，才能展现深度学习的优势。
在计算机眼中的图像信息就是一个矩阵，上面都是数值，每个像素值从0-255，一张图片被表示成三位数组，越低的像素值代表越暗，比如黑色。越高代表越亮，比如白色。一张图像数据有一个“颜色通道”，RGB图像代表三颜色通道。
实际使用中的人脸识别：遮蔽现象、背景混入（现在计算机的识别能力已经远超于人眼）——只要拥有遮蔽的数据，神经网络就能学习到遮蔽的现象，因此就可以学会判断遮蔽这种情况。因此深度学习最需要的就是数据信息，就是标签，就是分类器的训练。
K近邻算法：计算已知类别数据到选中点的距离；按照距离依次排序；选取与选中点距离最小的K个点；确定前K个点所在类别出现的概率；返回前K个点出现概率最高的类别作为选定点预测分类。
使用K近邻完成图像分类任务行不行？ CIFAR-10适合笔记本等普通电脑完成，100多M，数据量足够，数据大小比较小，32x32的像素值，（七八万以上的服务器才可以完成IMAGENET的数据分类任务.
图像距离的计算方法是自己定义的。
K近邻算法是根据图像距离的定义来进行划分的，不知道什么是主体，因此会将像素值相似的不同类东西划分到一起。