ML-1-定义、过(欠)拟合、正则化

1. 机器学习概述
1.1 机器学习
  • 概念:机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。对于机器学习有很多定义,个人认为Tom Mitchell(1988)的三元组定义十分精辟: 以性能度量 P P P进行衡量,如果一个计算机程序在某类任务 T T T上的性能,随着经验 E E E而提升,那么我们称这个计算机程序从经验 E E E中学习。
  • 要素:
    • 模型:比如线性模型、CNN
    • 学习准则(或策略):数学上表示为损失函数,比如期望风险、MSE、L1 Loss、Cross-Entropy Loss、0-1, quadratic平方、 max ⁡ ( 0 , − g ( x ) \operatorname{max}(0,-g(x) max(0,g(x)(Hinge)等等
    • 算法(或优化):梯度下降、封闭解(closed-form solution, 解析解)、SMO、ADMM
  • 类型:
    • 按任务:基本分为1)监督学习:对有标签的数据进行建模,可以预测无标签数据的标签;2)无监督学习:对无标签数据建模,提取数据信息来探索数据内的整体结构等信息;3)强化学习;4)互相交叉(通常是1)和2)交叉)的半监督、伪监督、自监督学习等;5)融合性的,如深度学习、集成学习等。
    • 按算法:1)在线学习:每次接受一个样本学习;2)批量学习:如字面。
    • 按模型:1)概率和模型( f ( x ) f(x) f(x) P ( Y ∣ X ) P(Y|X) P(YX)); 2)线性和非线性;2)参数化和非参数化;(参数有限且固定,参数无限或者不固定,感知机和决策树)。
    • 按技巧:1)贝叶斯学习,贝叶斯推理;2)核方法。
1.2 过拟合、欠拟合
  • 欠拟合: 模型在训练集上误差很大,测试集上也很大,一般是模型处理对应任务的能力不够。
  • 过拟合:模型在训练集上误差很小,但在测试数据上误差很大,一般有训练数据过小、噪音、模型能力过强等原因。
1.3 正则化

解决过拟合的方法有扩大训练集、使用验证器评估模型、正则化等。正则化的目的是一般为了降低经验损失,减小模型复杂度,防止模型过强而带来过拟合。具体来说,正则化就是在损失函数上加上某些规则(限制),缩小解空间,从而减少求出过拟合解的可能性,e.g., 为最小二乘加上L1, L2范数作为正则项形成岭回归、Lasso回归。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值