机器学习方法概论

最新推荐文章于 2022-07-31 09:23:20 发布

TREETRRRTREE

最新推荐文章于 2022-07-31 09:23:20 发布

阅读量299

点赞数

分类专栏：机器学习理论基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/luyunliang89/article/details/96622017

版权

本文概述了机器学习的基本概念，包括学习的定义、机器学习的目标和基本假设。介绍了统计机器学习的三要素——模型、策略和算法，并详细阐述了机器学习的基本步骤，如模型选择、策略确定和算法实现。此外，还讨论了模型评估、训练/验证/测试集的划分方法及其在监督学习中的应用。

摘要由CSDN通过智能技术生成

基本概念

学习的定义(Herbert A. Simon)

如果一个系统能够通过执行某个过程改进它的性能，这就是学习。

机器学习的定义(Tom Mitchell)

A program can be said to learn from experience E with respect to some class of task T and performance measure P, if its performance at tasks in T, as measured by P, mproves with experience E.

假设用P来评估计算机程序在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能改善，则我们就说关于T和P，该程序对E进行了学习。

机器学习的目标

基于数据构建模型，并运用模型对数据进行预测与分析。

机器学习的基本假设

数据具有统计规律性，可用随机变量描述数据中的特征，用概论分布描述数据的统计规律。
数据之间符合独立同分布(i.i.d)。
要学习的模型属于某个函数的集合，称为假设空间

统计机器学习的三要素

模型、策略和算法，方法 = 模型+策略+算法。

机器学习的基本步骤：

得到一个有限的训练数据集合；
确定包含所有可能的模型的假设空间，即学习模型的集合；
确定模型选择的准则，即学习的策略；
实现求解最优模型的算法，即学习的算法；
通过学习方法选择最优模型；
利用学习得到的最优模型对新数据进行预测或分析。

统计机器学习的分类

监督学习，非监督学习，半监督学习和强化模型。

监督学习中，根据输入变量X和输出变量Y的类型分类

X和Y均为连续变量称为回归问题。
Y为有限个离散变量称为分类问题。
X和Y为变量序列称为标注问题。

模型

条件概率分布P(Y|X)或者决策函数Y=f(X)。

策略

用损失函数(loss function)或者代价函数(cost function)来度量预测错误的程度，常用的损失函数包括：

0-1损失函数：

$L(Y,f(X)) = \begin{cases} 1 & \text{ if } Y\neq f(X) \\ 0 & \text{ if } Y= f(X) \end{cases}$

平方损失函数

$L(Y,f(X)) = (Y - f(X))^{2}$

绝对损失函数

$L(Y,f(X)) = \left | Y - f(X) \right |$

对数损失函数

L(Y,P(Y|X)) = -logP(Y|X)

输入输出遵循联合概率分布P(X,Y)，模型的期望损失如下：

<

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习方法概论

基本概念学习的定义(Herbert A. Simon)如果一个系统能够通过执行某个过程改进它的性能，这就是学习。机器学习的定义(Tom Mitchell)A program can be said to learn from experience E with respect to some class of task T and performance measure P, if...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。