什么是机器学习?

学习目标

  • 了解机器学习的定义
  • 知道机器学习的工作流程
  • 掌握获取到的数据集的特性

1、 机器学习的定义

机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测。

2、 机器学习工作流程

机器学习工作流程

  • 1.获取数据
  • 2.数据基本处理
  • 3.特征工程
  • 4.机器学习(模型训练)
  • 5.模型评估
    • 结果达到要求,上线服务
    • 没有达到要求,重新上面步骤

2.1 获取到的数据集介绍

  • 数据简介

    在数据集中一般:

    • 一行数据我们称为一个样本
    • 一列数据我们成为一个特征
    • 有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)
  • 数据类型构成:

    • 数据类型一:特征值+目标值(目标值是连续的和离散的)
    • 数据类型二:只有特征值,没有目标值
  • 数据分割:

    • 机器学习一般的数据集会划分为两个部分:
      • 训练数据:用于训练,构建模型
      • 测试数据:在模型检验时使用,用于评估模型是否有效
      • 划分比例:
        • 训练集:70% 80% 75%
        • 测试集:30% 20% 25%

2.2 数据基本处理

​ 即对数据进行缺失值、去除异常值等处理

2.3 特征工程

2.3.1什么是特征工程

特征工程是使用专业背景知识和技巧处理数据使得特征能在机器学习算法上发挥更好的作用的过程

  • 意义:会直接影响机器学习的效果

2.3.2 为什么需要特征工程(Feature Engineering)

2.3.3 特征工程包含内容

  • 特征提取
  • 特征预处理
  • 特征降维

2.3.4 各概念具体解释

  • 特征提取

    • 将任意数据(如文本或图像)转换为可用于机器学习的数字特征

特征预处理

  • 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程

特征降维

  • 指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程

2.4 机器学习

选择合适的算法对模型进行训练(具体内容见后文)

2.5 模型评估

对训练好的模型进行评估(具体内容见后文)

3、 小结

  • 机器学习定义【掌握】
    • 机器学习是从数据自动分析获得模型,并利用模型对未知数据进行预测
  • 机器学习工作流程总结【掌握】
    • 1.获取数据
    • 2.数据基本处理
    • 3.特征工程
    • 4.机器学习(模型训练)
    • 5.模型评估
      • 结果达到要求,上线服务
      • 没有达到要求,重新上面步骤
  • 获取到的数据集介绍【掌握】
    • 数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。
    • 数据集的构成:
      • 由特征值+目标值(部分数据集没有)构成
    • 为了模型的训练和测试,把数据集分为:
      • 训练数据(70%-80%)和测试数据(20%-30%)
  • 特征工程包含内容【了解】
    • 特征提取
    • 特征预处理
    • 特征降维
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值