本专栏为2024年西电秋季《机器学习》课程笔记。
目录
1.1.1 模型维度/模型的阶(维度设置过高过低都会导致结果不佳)
1.1.2 过拟合(模型在训练数据上表现得很好,但在新数据上的表现不佳,泛化能力较弱)
2.3 正则化(将保留所有的特征变量,但会减少特征变量的数量级)
一、机器学习基本概念
1.机器学习的定义:在没有明确编程的情况下,给予机器学习的能力
二、机器学习算法类型
1.监督学习
定义:机器利用带有标签的训练数据训练模型
- 回归问题:预测一个连续变量作为输出
- 分类问题:预测一个离散变量作为输出(例如0 1)
2.无监督学习
定义:机器利用无标签的训练数据训练模型
- 聚类
- 概率密度估计
- 降维/可视化