李宏毅机器学习PTT的理解(1)深度学习的介绍

深度学习的介绍

机器学习就像是寻找一个合适的函数,我们输入数据就可以得到想要的结果,比如:
在这里插入图片描述
在语音识别中,我们输入一段语音,函数的输出值就是识别的结果;在图像识别中,输入一张照片,函数可以告诉我们分类的结果;在围棋游戏中,输出的下一步落子的位置等。
学习的框架大致如下:
在这里插入图片描述
创建的模型可以看成是一系列的函数,输入我们的训练数据后,计算代价函数的值,选择一个最好的函数形式用于我们的模型,然后在测试集上进行测试,看能否呈现理想的结果。所以我们的学习大致可以分为三步:
在这里插入图片描述
形象点就像是那个笑话,把大象装进冰箱分为几步.。。。

在这里插入图片描述
那么在深度学习中,我们第一步不是定义一系列的函数,而是建立一个神经网络
在这里插入图片描述
下面来看深度学习的相关知识,首先我们看一下人脑中我们是怎么处理信息的,高中生物的知识可以想起来了:

在这里插入图片描述
我们首先来看一下单个神经元是如何工作的
在这里插入图片描述
ai(i= 1,2…k)是我们的输入,与权重做点积,加上偏置b传入激活函数便可以得到输出a。激活函数我们很常用的一个便是Logistic 回归中的sigmoid函数:
在这里插入图片描述
不同的神经元之间的连接便可以组成不同的网络模型,每一个神经元都可以有不同的权重和偏置值。如果每个神经元都彼此连接的话,便可以得到密集连接网络:
在这里插入图片描述
在这里插入图片描述

在全连接的神经网络中,所谓深就是指模型的隐藏层数很多,此外就是输入层和输出层:每一层由多个神经元组成
在这里插入图片描述
此外在输出层,Softmax常用于多分类问题,所有输出值的和为1,输出的概率值最大的那个类别就是我们的结果:
在这里插入图片描述
例如在下面的图像识别的例子中,经过我们模型的计算,第二个概率值为0.7,所以我们判别图像中的数字为2
在这里插入图片描述
具体的模型可以形象化的表示为如下,每个输入都是一个256维的向量,经过神经网络模型给出对于每一个类别的概率值,从而识别是哪一个数字;中间的网络模型需要我们设计,并设置比较好的超参数

在这里插入图片描述
接下来我们来看Step2:goodness of function,把大象装进冰箱!
在手写数字识别问题中,我们有如下的训练数据,我们希望我们的模型可以很好的识别出是哪个字:
在这里插入图片描述
我们模型设计为
在这里插入图片描述
每一个输入的图像都是一张16*16,大小为256像素的图像,所以输入就是一个256维的向量,输入到模型训练,然后通过输出层的Softmax给出最后的结果,比如数字为1时,那么我们的输出y1的值就应该是最大的。

那么我们该如何定义我们的损失函数呢?我们可以以网络的输出和真实值之间的距离作为损失,一个好的函数应该尽可能的减小损失,使得输出值逼近真实值。
在这里插入图片描述
当我们的输入不止一个数据时,我们就需要计算总损失值L,我们希望找到一个函数集和适合网络的参数集,使得损失值尽可能的小

在这里插入图片描述
第三步就是我们选择最好的函数,关上冰箱门
当我们的模型隐藏层很多,每一层的神经元数目很多时,我们的参数就会有很多,枚举每一个参数值显然是不切实际的
在这里插入图片描述
所以我们就要寻找其他的方法来解决这个问题,梯度下降法就一个很好的选择,初始化参数后,我们通过计算梯度值不断的接近一个局部的最小值
在这里插入图片描述
计算过程可以这样来看
在这里插入图片描述
在三维图像中,我们可以更形象化的看出梯度下降是如何执行的

在这里插入图片描述

机器学习(Machine Learning, ML)是一种应用人工智能(AI)领域的科学技术,它使得计算机系统能够从数据中自动学习和改进,而无需显式编程。在机器学习的过程中,算法会通过识别和挖掘数据中的模式来构建一个模型,这个模型可以用于做出预测、分类、聚类、回归以及其他复杂的数据驱动决策。 机器学习的主要类型包括监督学习、无监督学习和半监督学习。在监督学习中,算法根据已知标签的数据集进行训练,以便对未知数据进行预测,例如分类任务(判断邮件是否为垃圾邮件)或回归任务(预测房价)。无监督学习则是在没有标签的情况下,仅凭数据本身的特征发现其中隐藏的结构或模式,如聚类分析(将用户分组到不同的客户细分群体中)。半监督学习介于两者之间,它部分数据有标签,部分数据无标签。 机器学习算法涵盖众多方法,包括但不限于逻辑回归、决策树、随机森林、支持向量机、K近邻算法、神经网络以及深度学习技术等。随着计算能力的增强和大数据时代的到来,机器学习已经在诸多领域展现出强大的功能,如图像识别、语音识别、自然语言处理、推荐系统、金融风控、医疗诊断等。 此外,机器学习的发展与统计学习、逼近论、凸优化、概率论等诸多数学和计算机科学领域紧密相关,且不断地推动着新算法和理论框架的创新与发展。同时,现代机器学习尤其是深度学习模型的内部工作机制有时难以完全解释,因此常被称为“黑箱”决策过程,这也是当前研究中的一个重要挑战。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值