关于深度学习在图像识别上应用的学习笔记

关于深度学习在图像识别上应用的学习笔记1

仅是关于我在深度学习基础知识的学习过程中的一些整理,有错漏之处需要大家指出,谢谢

一、什么是深度学习
首先我们要明确人工智能的概念,如果用集合的思想来看待人工智能,机器学习以及深度学习三者的关系来看,人工智能应该是最大的集合,而机器学习包含于人工智能,深度学习又是机器学习的一个分支,三者的关系应该为人工智能 > 机器学习 > 深度学习。

何为人工智能?用自己的理解来看,就是将人类平时具有思想的行为用机器复现。让机器具备有人的智能行为,将人类完成的智力任务自动化。

首先在机器学习概念出来之前,人们普遍接受的是“符号主义人工智能”。符号主义人工智能,就是当时的科学家普遍认为,只要编写足够量的高质量代码,精心编写足够多的规则,就能使机器具备有完成所有智能任务的能力。但事实并不是这样,显然,这依旧停留在“我们在帮机器思考”的范畴,就是机器好比一个蹒跚学步的孩子,对世界充满未知,我们像操心一切的父母,提前告诉他什么什么是对的,什么什么不能做。可是,世界的复杂性使得我们不可能考虑,也没有能力考虑到所有情况。所以,符号主义人工智能是不全面的。

之后人们便提出了新的理念,就是希望机器自己具备有学习能力,而我们要做的,就是能够让机器从足够多的例子中自己学会辨别是非。人类的学习能力是奇妙而伟大的,你给一个小孩子看猫的图片,看上一两张,两三张,这个孩子可能就会举一反三,辨别出世界上的大部分的猫。为了让机器具备有“举一反三”的能力,我们付出了巨大的努力,这也是现阶段所有从事这方面研究的学者们一致的目标:如何让这个学习的过程精确且高效。

我们类比一下程序设计和机器学习的异同点。我们平时在编写程序的时候,我们使用诸如C,C++,JAVA等语言编写一个程序,比如输入两个数a和b,输出两数之和。我们写的是规则,就是读取两个数,使他们加起来,输出和。我们输入的数据,比如输入1 和 2,输出的就是3。那么我们是使用 规则 + 数据 -> 程序设计 -> 输出 这个模式。但是我们在机器学习中,不可能遍历所有的规则,所以就像我们指着第一张图片告诉孩子“这是猫”一样,我们告诉机器一个答案“什么样的东西称之为猫”,然后我们再给他看一张图片,期待他做出正确的回答。机器用习得的答案判断我们的输入数据,做出正确的答复,正确率越高,机器学习的效果越好。所以,在机器学习中,我们沿用的是 数据 + 答案 -> 机器学习 -> 输出 模式。
在这里插入图片描述
在机器学习中,我们面临的核心问题,是有意义地变换数据,将输入映射到目标。在这里引出一个机器学习的技术定义:在预先设定好的可能性空间中,利用反馈信息的指引来寻找输入信息的有用表示。

我们依旧需要深刻理解机器学习中“学习”的内容。我们拥有了数据点,比如某张动物的图片,我们需要一个判断,即这张图片是不是猫,同时在这个判断的过程中,我们需要有一个校正的过程,用来计算当前的输出与预期输出的差距。比如我们给了一张老虎的图片,机器误认为是猫。在错误发生的时候,我们需要矫正。综合起来,对于机器学习,我们需要具备三个要素:输入数据点,预期输出的示例,以及衡量算法效果好坏的方法。这个衡量的结果是一个反馈信号,用于调节算法的工作方式。这种调节,就是我们所称的“学习”。

深度学习,是机器学习的一个分支,强调从连续的“层”中进行学习。含有多少层为他的深度。这些分层又是通过神经网络的模型学习得到。
在这里插入图片描述
我们可以将这些层想象成一系列蒸馏操作,我们得到的信息穿过这些层,就像进入一个又一个过滤器,最后得到的是高纯度的输出。而这个输出可能和你的输入完全不同,也许是一个结论,一句话,一个判断,一组数据。也许你的输入只是一张动物的图片,而你的输出是一句话:“是猫”。

所以,深度学习的技术定义:学习数据表示的多级方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值