机器学习篇-1.概念篇

1.人工智能三大概念:

  • 人工智能:(AI), 仿智,机器模拟人类理性思考、活动
  • 机器学习:(ML),机器自动学习
  • 深度学习: (DL),也叫深度神经网络,大脑仿生,设置一层一层的神经元模拟万事万物。
  1. 以上三者之间的关系:
    • 机器学习是实现人工智能的一种途径。
    • 深度学习是机器学习的一种算法。

2.学习方式:

  1. 基于规则的学习:程序员if-else进行预测
  2. 基于模型的学习:机器通过模型训练自动学习

3.机器学习三要素:

  1. 数据
  2. 算法
  3. 算力

4.机器学习常见术语:

  1. 样本:一条数据就是一个样本
  2. 特征:一列数据为一个特征,也叫属性
  3. 标签/目标:模型要预测的那一列数据
  4. 数据集可划分为:
    • 训练集:用来训练模型的数据集
    • 测试集:用来测试模型的数据集
    • 训练集、测试集比例:8:2 , 7:3
  5. 常用
    • x_train:训练集的特征
    • y_train:训练集的目标
    • x_test:测试集的特征
    • y_test:测试集的目标

5. 算法分类:

  1. 有监督学习:有特征,有目标
    • 如果目标值是连续的,则是分类
      • 分类种类:
        • 二分类:目标值类似于只有是否两个结果
        • 多分类:多个目标值
    • 如果目标值是离散的,则是回归
  2. 无监督学习:有特征,无目标
    • 根据样本间的相似性对样本集进行聚类。
  3. 半监督学习:有部分有目标,有部分没有目标
  4. 强化学习:完成任务时,类似于得到奖励,没完成则给予惩罚。

6.机器学习的建模流程:

  1. 获取数据
  2. 数据基本处理
  3. 特征工程
    • 概念:特征工程是利用专业背景知识和技巧处理数据,让机器学习算法效果最好的过程
    • 特征工程内容:
      • 特征提取
      • 特征预处理
      • 特征降维
      • 特征选择
      • 特征组合
  4. 机器学习(模型训练)
  5. 模型评估

7.模型拟合问题:

  1. 欠拟合:

    • 表现: 模型在训练集上表现很差,在测试集表现也差
    • 原因:模型过于简单
  2. 过拟合:

    • 表现:模型在训练集上表现很好,在测试集表现很差
    • 原因:模型太过于复杂、数据不纯、训练数据太少
  3. 泛化:

    • 概念:模型在新数据集(非训练数据)上的表现好坏的能力
      奥卡姆剃刀原则:
    • 给定两个具有相同泛化误差的模型,较简单的模型比较复杂的模型更可取。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值