机器学习大纲(待完善)

拌面一碗大

已于 2023-09-21 11:19:12 修改

阅读量65

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

于 2023-09-17 16:01:01 首次发布

本文链接：https://blog.csdn.net/qq_51484276/article/details/132945027

版权

3 篇文章 0 订阅

订阅专栏

工作流程(五步)
- 1. 获取数据
    - 数据集
      - 样本
        一行数据
      - 特征
        一列数据
      - 有些数据有目标值（标签值），有些数据没有目标值
      - 类型构成
        数据类型一：特征值+目标值（目标值是连续的和离散的）
        数据类型二：只有特征值，没有目标值
        聚类算法
      - 数据分割
        训练数据
        用于训练，构建模型
        训练集：70% 80% 75%
        
        测试数据
        在模型检验时使用，用于评估模型是否有效
        测试集：30% 20% 25%
- 1. 数据基本处理
    - 缺失值
    - 异常值
- 1. 特征工程
    - 概念
      - 使用专业背景知识和技巧处理数据，使得特征能在机器学习算法上发挥更好的作用的过程
    - 意义
      - 会直接影响机器学习的效果
    - 包含的内容
      - 特征提取
      - 特征预处理
      - 特征降维
- 1. 机器学习(模型训练)
    - 选择合适的算法对模型进行训练
- 1. 模型评估
    - 结果达到要求，上线服务
    - 没有达到要求，重新上面步骤

准确率：预测正确数量与总样本数量的比例 (TP+TN)/(TP+FN+FP+TN)
精确率：你认为的正样本中，有多少是真的正确的概率 TP/(TP+FP)
召回率：正样本中有多少是被找了出来 TP/(TP+FN)
F1-score：
$\frac{2}{\frac{1}{precision} + \frac{1}{recall}} = 2\frac{precision*recall}{precision+recall} = \frac{TP}{TP +\frac{FN+FP}{2}}$
AUC指标：
- 测量曲线下面积
- 完美分类器的ROC AUC等于1，而纯随机分类器的ROC AUC等于0.5