机器学习——绪论(Introduction)

一、机器学习发展历程

  1. 逻辑推理,例如神经网络(neural networks)等
  2. 基于知识学习,例如专家系统(expert systems)等
  3. 归纳和统计学习,例如BP神经网络、统计学习等
  4. 深度学习,例如深度神经网络(deep neural networks)等

二、传统编程 vs. 机器学习

  1. 传统编程:具有明确指令流程的计算机程序,由数据(data)和程序(program)得到结果(results)
  2. 机器学习:自动向示例学习的计算机程序,由数据(data)和结果(results)得到程序(program)

三、机器学习关键四要素

  1. 数据(data)
  2. 模型(model),即对数据作出的假设
  3. 损失函数(loss function),即对模型作出的评价标准
  4. 优化算法(optimal algorithm),即以损失函数为标准对模型作出改善

总而言之,机器学习即是使用模型使机器能够使用数据朝着损失函数优化

四、机器学习系统流程

  1. 数据准备,包括数据收集、数据预处理(pre-processing)、特征提取(feature extraction)
  2. 训练模型,包括训练模型(train)和验证模型(validation)
  3. 评估模型,包括测试模型(test)和评估模型(evaluation)

五、机器学习算法分类

  1. 有监督学习(supervised learning):数据有输入以及对应的期望输出(即有标签),例如分类、回归等
  2. 无监督学习(unsupervised learning):数据只有输入而无对应的期望输出(即无标签),例如聚类、降维、概率估计等
  3. 强化学习(reinforcement learning):学习从状态(state)行动(action)的映射,以最大化长期回报(reward),例如蒙特卡洛方法等

六、机器学习中的重要概念

  1. 泛化(generalization):学习通用模式,而非细节(如噪声)
  2. 偏差(bias):模型对数据的拟合度
  3. 方差(variance):模型的复杂度(自由度)
  4. 欠拟合(underfitting):模型过于简单未学习到数据中的知识,即低复杂度、低方差、高偏差
  5. 过拟合(overfitting):模型过于复杂而学习到了数据中的细节(如噪声),即高复杂度、高方差、低偏差

七、削弱过拟合的方法

  1. 增加训练数据
  2. 正则化(regularization):惩罚模型复杂度,例如L1范数惩罚项、L2范数惩罚项
  3. 保留和交叉验证(Hold-out & cross validation):在训练阶段保留部分数据,交叉验证使充分利用数据
  4. 早停止:在可能过拟合前停止训练,例如验证集损失开始上升等

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

学习啊ZzZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值