机器学习方法概论

本文概述了机器学习的基本概念,包括学习的定义、机器学习的目标和基本假设。介绍了统计机器学习的三要素——模型、策略和算法,并详细阐述了机器学习的基本步骤,如模型选择、策略确定和算法实现。此外,还讨论了模型评估、训练/验证/测试集的划分方法及其在监督学习中的应用。
摘要由CSDN通过智能技术生成

基本概念

学习的定义(Herbert A. Simon)

如果一个系统能够通过执行某个过程改进它的性能,这就是学习。

机器学习的定义(Tom Mitchell)

A program can be said to learn from experience E with respect to some class of task T and performance measure P, if its performance at tasks in T, as measured by P, mproves with experience E.

假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

机器学习的目标

基于数据构建模型,并运用模型对数据进行预测与分析。

机器学习的基本假设

  1. 数据具有统计规律性,可用随机变量描述数据中的特征,用概论分布描述数据的统计规律。
  2. 数据之间符合独立同分布(i.i.d)。
  3. 要学习的模型属于某个函数的集合,称为假设空间

统计机器学习的三要素

模型、策略和算法,方法 = 模型+策略+算法。

机器学习的基本步骤:

  1. 得到一个有限的训练数据集合;
  2. 确定包含所有可能的模型的假设空间,即学习模型的集合;
  3. 确定模型选择的准则,即学习的策略;
  4. 实现求解最优模型的算法,即学习的算法;
  5. 通过学习方法选择最优模型;
  6. 利用学习得到的最优模型对新数据进行预测或分析。

统计机器学习的分类

监督学习,非监督学习,半监督学习和强化模型。

监督学习中,根据输入变量X和输出变量Y的类型分类

  1. X和Y均为连续变量称为回归问题。
  2. Y为有限个离散变量称为分类问题。
  3. X和Y为变量序列称为标注问题。

模型

条件概率分布P(Y|X)或者决策函数Y=f(X)。

策略

用损失函数(loss function)或者代价函数(cost function)来度量预测错误的程度,常用的损失函数包括:

  • 0-1损失函数:

L(Y,f(X)) = \begin{cases} 1 & \text{ if } Y\neq f(X) \\ 0 & \text{ if } Y= f(X) \end{cases}

  • 平方损失函数

L(Y,f(X)) = (Y - f(X))^{2}

  • 绝对损失函数

L(Y,f(X)) = \left | Y - f(X) \right |

  • 对数损失函数

L(Y,P(Y|X)) = -logP(Y|X)

输入输出遵循联合概率分布P(X,Y),模型的期望损失如下:

<
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值