阿里云人工智能课程(二)机器学习算法简介

本文介绍了机器学习的主要步骤,包括输入数据、特征工程、模型训练和部署,以及模型应用。同时,详细阐述了机器学习的基本概念,如输入空间、输出空间、特征向量和假设空间。此外,探讨了机器学习的三要素:模型、策略和评估,重点讨论了损失函数在模型优化中的作用,包括不同类型的损失函数及其应用场景。
摘要由CSDN通过智能技术生成

机器学习方法流程

在这里插入图片描述
主要分为以下几步:

  1. 输入数据
  2. 特征工程
  3. 模型训练:建模
  4. 模型部署
  5. 模型应用:如预测

基本概念

  • Input Space:输入的所有可能取值的集合称作输入空间
  • Output Space: 输出的所有可能取值的集合称作输出空间
  • Feature:即属性。每个输入实例的各个组成部分(属性)称作原始特征,基于原始特征还可以扩展出更多的衍生特征
  • Feature Vector:多个特征组成的集合,称作特征向量
  • Feature Space:特征向量存在的空间,称作特征空间
  • Hypothesis Space:由输入空间到输出空间的映射的集合,称作假设空间

1.The hypothesis space, which defines the class of functions mapping the input space to the output space. That is, the functions operate on the feature vectors of the input objects, and make predictions according to the format of the output space.
2.假设空间指的是:问题所有假设所组成的空间,我们可以把学习过程看作是在假设空间中搜索的过程,搜索目标是寻找与训练集“匹配”的假设。——周志华《机器学习》
推荐用书 《统计学方法》以及周志华老师的西瓜书

机器学习三要素
  1. 模型:输入空间到输出空间的映射关系。学习过程即从假设空间中搜索适合当前数据的假设。
  2. 策略:从假设空间众多假设中选择最优的模型的学习标准或规则。
    • 评估某个模型对单个训练样本的效果
    • 评估某个模型对训练集的整体效果
    • 评估某个模型对包括训练集、预测集在内的所有数据的整体效果
      策略效果的衡量使用:损失函数(Loss Function)

损失函数:用来衡量预测结果和真实结果之间的差距,其值越小,代表预测结果和真实结果越一致。通常是一个非负实值函数。通过各种方式缩小损失函数的过程被称作优化。损失函数记作:L(Y,f(x))。

  • 0-1 损失函数:下图中,T为自定义的阈值
    0-1损失函数
  • 绝对值损失函数:预测值与真实值差的绝对值。
    在这里插入图片描述
  • 平方损失函数:预测值与真实值差的平方。
    在这里插入图片描述
  • 对数损失函数/对数似然损失函数:对数函数具有单调性,在求最优化问题时,结果与原始目标一致。可将乘法转化为加法,简化计算。
    在这里插入图片描述
  • 指数损失函数:单调性,非负性的优良性质,使得越接近正确结果误差越小。
    在这里插入图片描述
  • 折叶损失函数/铰链损失函数:对于判定边界附近点的惩罚力度较高,常见于SVM。
    在这里插入图片描述

损失函数的适用场景

  • 0-1:理想状况模型
  • Log:逻辑回归,交叉熵
  • Squared:线性回归
  • Exponential:AdaBoosting
  • Hinge(折叶):SVM、soft margin

经验风险:将整个训练集所有记录均进行一次与猜测,求取损失函数,将所有值累加,即为经验风险。经验风险越小说明模型f(x)对训练集的拟合程度越好。(对局部,即训练集)
公式为:
R

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值