花书读书笔记(四)-机器学习基础

本文是《深度学习》(花书)的读书笔记,涵盖了学习算法、容量与过拟合、超参数、估计与偏差、最大似然估计、贝叶斯统计、监督与无监督学习、随机梯度下降以及深度学习面临的挑战等内容。
摘要由CSDN通过智能技术生成

全部笔记的汇总贴:《深度学习》花书-读书笔记汇总贴

一、学习算法

机器学习算法是一种能够从数据中学习的算法。

  1. 任务 T T T
  2. 性能度量 P P P
  3. 经验 E E E

二、容量、过拟合和欠拟合

在先前未观测到的输入上表现良好的能力被称为泛化(generalization)。

决定机器学习算法效果是否好的因素:

  1. 降低训练误差。
  2. 缩小训练误差和测试误差的差距。

这两个因素对应机器学习的两个主要挑战:欠拟合(underfitting)和过拟合(overfitting)。欠拟合是指模型不能在训练集上获得足够低的误差。而过拟合是指训练误差和和测试误差之间的差距太大。

没有免费午餐定理(no free lunch theorem)表明,在所有可能的数据生成分布上平均之后,每一个分类算法在未事先观测的点上都有相同的错误率。换言之,在某种意义上,没有一个机器学习算法总是比其他的要好。我们能够设想的最先进的算法和简单地将所有点归为同一类的简单算法有着相同的平均性能(在所有可能的任务上)。

三、超参数和验证集

大多数机器学习算法都有超参数,可以设置来控制算法行为。

用于挑选超参数的数据子集被称为验证集(validation set)。

四、估计、偏差和方差

θ \theta θ的点估计一般用 θ ^ \hat\theta θ^来表示。

估计的偏差定义为: b i a s ( θ ^ m ) = E ( θ ^ m ) − θ bias(\hat\theta_m)=E(\hat\theta_m)-\theta bias(θ^m)=E(θ^m)θ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值