记———机器学习基础入门大纲

机器学习

  • 数学基础
    1.微积分
    2.矩阵计算
    3.线性代数
    4.概率论
    5.数理分析
    传统机器学习算法:
    1.K-近邻算法
    2.决策树
    3.朴素贝叶斯
    4.逻辑回归
    5.支持向量机
    6.聚类
    7.主成分分析

  • 机器学习概念

    • 从已知数据中总结经验规律,并对未知数据进行预测。
    • E (经验 ——降低了可解释性)
    • P(计算机程序的性能)
    • T(任务)
  • 机器学习算法分类

    • 学习方式分类:
      • 监督学习
        • 目标值与预测值比较(有评价)
          • 回归
          • 分类
      • 非监督学习
        • 聚类
        • 降维
      • 半监督学习
        • 异常检测
        • 强化学习
        • 模型的超参
        • 模型的优化
  • 机器学习基本术语:

    • 特征(数据集列):index(不是特征)
    • 维数、维度空间
    • 泛化、归纳、演绎
  • 模型评估

    • 错误率
      • E=错误数量再总样本的占比
    • 准确率 A=1 -E
    • 训练误差
    • 测试误差
    • 过拟合
  • 判别方法:

    • 误差
    • 泛化
    • 偏差
    • 方差
      -学习曲线
  • 数据集的拆分

    • 留出法、k折交叉验证法、自助法
    • 数据集是随机抽取且独立同分布的
    • 分布是平稳的,不随时间的变化而变化始终从一个分布取出
    • 留出法8:2 取出为训练集和测试集
  • 参数调节

    • 调参
  • 模型评价

    • 分类模型的评价:
      • 混淆矩阵
      • 评价指标
      • 准确率
      • 精确率
      • 召回率
      • F1值
        • 精确率和召回率权重一样·
      • ROC 和AUC
        • Roc
          • 召回率和假正率
    • 回归模型的评价:
      • 平均绝对误差
      • 均方误差
      • 均根方误差
      • 决定系数
Scikit-learn
  • 分类

  • 回归

  • 聚类

  • 数据降维

  • 模型选择

    • 网格搜索
    • 交叉验证
    • 预测误差
  • 数据预处理(机器学习第一步)

    • 特征提取
    • 归一化
  • 后记:
    有需要的朋友可以搜索微信公众号:【知音库
    这里有个人总结的文章,本人是大数据专业学生,
    同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值