1. 数据
通常用一个 维向量
来表示一个数据的所有特征向量,而数据标签通常用标量 来表示。
2. 数据集
假设数据集 存在
个样本,记为
数据集一般分为训练集和测试集。训练集中的样本用于模型训练,而测试集是用于检验模型好坏。
3. 机器学习的关键
在给定数据集上,我们希望计算机从一个函数集合
中自动寻找一个“最优”的函数 来近似每个样本的特征向量
和标签
之间的真实映射。
如何寻找这个“最优”的函数就是机器学习的关键。
1. 数据
通常用一个 维向量
来表示一个数据的所有特征向量,而数据标签通常用标量 来表示。
2. 数据集
假设数据集 存在
个样本,记为
数据集一般分为训练集和测试集。训练集中的样本用于模型训练,而测试集是用于检验模型好坏。
3. 机器学习的关键
在给定数据集上,我们希望计算机从一个函数集合
中自动寻找一个“最优”的函数 来近似每个样本的特征向量
和标签
之间的真实映射。
如何寻找这个“最优”的函数就是机器学习的关键。