机器学习重点内容概述

1.说明有监督学习和无监督学习的各自的特点及区别

有监督学习的特点:

  • 输入数据是由输入特征值和目标值所组成, 即输入的训练数据是有标签的.

    • 数据集: 需要人工标注数据.

无监督学习的特点:

  • 输入的数据没有被标记, 没有标签;

  • 根据样本间的相似性, 对样本集聚类, 以发现事物内部的结构及相互关系.

区别:

有监督学习输入的数据是有标签的, 而无监督学习输入的数据是无标签的。区别如下图:

2. 说明下机器学习的建模流程

1. 获取数据

2. 数据基本处理

3. 特征工程

4. 机器学习(模型训练)

5. 模型评估

注意: 

  • 在整个建模流程中, 数据基本处理 和 特征工程 一般是耗时, 耗精力最多的!!!

3.说下模型拟合问题及产生的原因

模型拟合会出现三种情况:

  • 刚好拟合: 表示模型对样本点的拟合情况刚刚好.

    • 原因: 特征选取和模型选取及训练刚刚好.

  • 欠拟合: 模型在训练集上表现很差、在测试集表现也很差.

    • 原因: 模型过于简单.

  • 过拟合: 模型在训练集上表现很好、在测试集表现很差.

    • 原因: 模型过于复杂, 数据不纯, 训练数据太小.

  • 8
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值