关于深度学习在图像识别上应用的学习笔记

最新推荐文章于 2024-03-14 16:21:55 发布

0.7.V

最新推荐文章于 2024-03-14 16:21:55 发布

阅读量463

点赞数

文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/qq_44168840/article/details/104447951

版权

关于深度学习在图像识别上应用的学习笔记1

仅是关于我在深度学习基础知识的学习过程中的一些整理，有错漏之处需要大家指出，谢谢

一、什么是深度学习
首先我们要明确人工智能的概念，如果用集合的思想来看待人工智能，机器学习以及深度学习三者的关系来看，人工智能应该是最大的集合，而机器学习包含于人工智能，深度学习又是机器学习的一个分支，三者的关系应该为人工智能 > 机器学习 > 深度学习。

何为人工智能？用自己的理解来看，就是将人类平时具有思想的行为用机器复现。让机器具备有人的智能行为，将人类完成的智力任务自动化。

首先在机器学习概念出来之前，人们普遍接受的是“符号主义人工智能”。符号主义人工智能，就是当时的科学家普遍认为，只要编写足够量的高质量代码，精心编写足够多的规则，就能使机器具备有完成所有智能任务的能力。但事实并不是这样，显然，这依旧停留在“我们在帮机器思考”的范畴，就是机器好比一个蹒跚学步的孩子，对世界充满未知，我们像操心一切的父母，提前告诉他什么什么是对的，什么什么不能做。可是，世界的复杂性使得我们不可能考虑，也没有能力考虑到所有情况。所以，符号主义人工智能是不全面的。

之后人们便提出了新的理念，就是希望机器自己具备有学习能力，而我们要做的，就是能够让机器从足够多的例子中自己学会辨别是非。人类的学习能力是奇妙而伟大的，你给一个小孩子看猫的图片，看上一两张，两三张，这个孩子可能就会举一反三，辨别出世界上的大部分的猫。为了让机器具备有“举一反三”的能力，我们付出了巨大的努力，这也是现阶段所有从事这方面研究的学者们一致的目标：如何让这个学习的过程精确且高效。

我们类比一下程序设计和机器学习的异同点。我们平时在编写程序的时候，我们使用诸如C，C++，JAVA等语言编写一个程序，比如输入两个数a和b，输出两数之和。我们写的是规则，就是读取两个数，使他们加起来，输出和。我们输入的数据，比如输入1 和 2，输出的就是3。那么我们是使用规则 + 数据 -> 程序设计 -> 输出这个模式。但是我们在机器学习中，不可能遍历所有的规则，所以就像我们指着第一张图片告诉孩子“这是猫”一样，我们告诉机器一个答案“什么样的东西称之为猫”，然后我们再给他看一张图片，期待他做出正确的回答。机器用习得的答案判断我们的输入数据，做出正确的答复，正确率越高，机器学习的效果越好。所以，在机器学习中，我们沿用的是数据 + 答案 -> 机器学习 -> 输出模式。
在这里插入图片描述
在机器学习中，我们面临的核心问题，是有意义地变换数据，将输入映射到目标。在这里引出一个机器学习的技术定义：在预先设定好的可能性空间中，利用反馈信息的指引来寻找输入信息的有用表示。

我们依旧需要深刻理解机器学习中“学习”的内容。我们拥有了数据点，比如某张动物的图片，我们需要一个判断，即这张图片是不是猫，同时在这个判断的过程中，我们需要有一个校正的过程，用来计算当前的输出与预期输出的差距。比如我们给了一张老虎的图片，机器误认为是猫。在错误发生的时候，我们需要矫正。综合起来，对于机器学习，我们需要具备三个要素：输入数据点，预期输出的示例，以及衡量算法效果好坏的方法。这个衡量的结果是一个反馈信号，用于调节算法的工作方式。这种调节，就是我们所称的“学习”。

深度学习，是机器学习的一个分支，强调从连续的“层”中进行学习。含有多少层为他的深度。这些分层又是通过神经网络的模型学习得到。
在这里插入图片描述
我们可以将这些层想象成一系列蒸馏操作，我们得到的信息穿过这些层，就像进入一个又一个过滤器，最后得到的是高纯度的输出。而这个输出可能和你的输入完全不同，也许是一个结论，一句话，一个判断，一组数据。也许你的输入只是一张动物的图片，而你的输出是一句话：“是猫”。