深度学习——监督式机器学习基础

1、机器学习系统:通过学习如何组合输入信息来对未见过的数据做出有用的预测(谷歌机器学习速成课程定义)

2、术语:标签和特征

  • 标签是我们要预测的真实事物:y
  • 特征是指用于描述数据的输入变量:x

3、术语:样本和模型

  • 样本是指数据的特定实例:x
    • 有标签样本具有{特征,标签}:{x,y},用于训练模型
    • 无标签样本具有{特征,?}:{x,?},用于对新数据做出预测
  • 模型可将样本映射到预测标签:y`,由模型的内部参数定义,这些内部参数值是通过学习得到的

4、术语:训练

训练模型表示通过有标签样本来学习(确定)所有权重和偏差的理想值。

在监督式学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少损失的模型,这一过程称为经验风险最小化。

5、术语:损失

损失是对糟糕预测的惩罚:损失是一个数值,表示对于单个样本而言模型预测的准确程度

如果模型预测完全准确,则损失为0,否则损失会较大

训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差

  • 定义损失函数
    • L1损失:基于模型预测的值与标签的实际值之差的绝对值
    • 平方损失:一种常见的损失函数,又称为L2损失

均方误差(MSE)指的是每个样本的平均平方损失

6、模型训练与降低损失

训练模型的迭代方法

  • 模型训练要点:

(1)首先对权重w和偏差b进行初始猜测

(2)然后反复调整这些猜测

(3)直到获得损失可能最低的权重和偏差为止

  • 收敛:在学习优化过程中,机器学习系统将根据所有标签去重新评估所有特征,为损失函数生成一个新值,而该值又产生新的参数值。通常,可以不断迭代,直到总体损失不再变化或至少变化极其缓慢为止。这时,我们可以说该模型已收敛。

7、梯度下降

梯度:一个向量(矢量),有大小和方向,表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大

8、学习率

沿着负梯度方向进行下一步探索,用梯度乘以一个称为学习速率(步长)的标量,以确定下一个点的位置

9、超参数

在机器学习中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。

通常情况下,需要对超参数进行优化,选择一组好的超参数,可以提高学习的性能和效果

超参数是编程人员在机器学习算法中用于调整的旋钮

典型超参数:学习率、神经网络的隐含层数量

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值