Deep Learning 第五章 机器学习基础

本文深入探讨了机器学习的基础,包括学习算法的概念,如任务T、性能度量P和经验E。详细介绍了线性回归,以及如何通过正则化防止过拟合。讨论了超参数、验证集和交叉验证在模型选择中的作用。同时,阐述了估计、偏差和方差的重要性,以及如何权衡它们以优化模型。此外,还涵盖了最大似然估计和贝叶斯统计,包括最大后验(MAP)估计。最后,简要概述了监督学习算法,如支持向量机(SVM)和其他简单算法,以及无监督学习中的主成分分析(PCA)和k-均值聚类。
摘要由CSDN通过智能技术生成

5.1 学习算法

概念:对于某类任务 T 和性能度量P,一个计算机程序被认为可以从经验 E 中学习是指,通过经验 E 改进后,它在任务 T 上由性能度量 P 衡量的性能有所提升。

5.1.1 任务T

常见机器学习任务

5.1.2 性能度量 P

准确率,错误率

5.1.3 经验 E

根据不同经验,分为无监督和监督学习算法

5.1.4 线性回归

简单实例

5.2 容量、过拟合和欠拟合

  • 在先前未观测到的输入上表现良好的能力被称为泛化 (generalization)。
    • 训练误差,测试误差(泛化误差)
    • 在我们的线性回归实例中,我们通过最小化训练误差来训练模型
  • 通俗地,模型的容量是指其拟合各种函数的能力。

5.2.1 没有免费午餐定理

没有通用的学习算法或是绝对好的学习算法,没有最优的正则化形式

5.2.2 正则化

权重衰减(w为权重):修改线性回归的训练标准,MSE+正则项(λ控制)=J(w)

正则化是指我们对学习算法所做的降低泛化误差而非训练误差的修改

5.3 超参数和验证集

多项式回归实例中,有一个超参数:多项式的次数,作为容量超参数。控制权重衰减程度的 λ 是另一个超参数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值