机器学习--算法分类与模型评估02

机器学习算法分类与模型评估

一、机器算法分类

  • 根据数据集组成不同,可以把机器学习算法分为:
  1. 监督学习
  2. 无监督学习
  3. 半监督学习
  4. 强化学习

1、监督学习

定义:

输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类),即回归问题和分类问题。

2、无监督学习

定义:
输入数据是由输入特征值组成,没有目标值;输入数据没有被标记,也没有确定的结果。样本数据类别未知;需要根据样本间的相似性对样本集进行类别划分。

  • 有监督,无监督算法对比:
    在这里插入图片描述

3、半监督学习

定义: 训练集同时包含有标记样本数据和未标记样本数据。

4、强化学习

定义: 实质是make decisions 问题,即自动进行决策,并且可以做连续决策。

举例:
小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。
小孩就是 agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另一个状态(即他走的每一步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。主要包含五个元素:agent, action, reward, environment, observation;强化学习的目标就是获得最多的累计奖励。

监督学习和强化学习的对比

二、模型评估

1、分类模型评估

  • 准确率
    • 预测正确的数占样本总数的比例。
    • 其他评价指标:精确率、召回率、F1-score、AUC指标等

2、回归模型评估

  • 均方根误差(Root Mean Squared Error,RMSE)
    • RMSE是一个衡量回归模型误差率的常用公式。 不过,它仅能比较误差是相同单位的模型。
    • 其他评价指标:相对平方误差(Relative Squared Error,RSE)、平均绝对误差(Mean Absolute Error,MAE)、相对绝对误差(Relative Absolute Error,RAE)

3、拟合

模型评估用于评价训练好的的模型的表现效果,其表现效果大致可以分为两类:过拟合、欠拟合。
在训练过程中,你可能会遇到如下问题:
训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?
当算法在某个数据集当中出现这种情况,可能就出现了拟合问题。

  • 欠拟合:模型学习的太过粗糙,连训练集中的样本数据特征关系都没有学出来。
  • 过拟合:所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在测试数据集中表现不佳。
  • 欠拟合
    • 学习到的东西太少
    • 模型学习的太过粗糙
  • 过拟合
    • 学习到的东西太多
    • 学习到的特征多,不好泛化
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值