绪论
机器学习的定义:
机器学习是指计算机系统通过从数据中学习和改进,改善系统自身的性能
基础术语
**样本(示例):**数据集”中每条记录是关于一个事件或对象(这里是一个西瓜)的描述,称为一个"示例"或"样本"
**属性:**反映事件或对象在某方面的表现或性质的事项
**属性值:**属性上的取值
**特征向量:**以几个特征作为坐标系,每个样本都可在这个空间中找到自己的坐标位
置,由于空间中的每个点对应一个坐标向量,每个样本都是特征向量
**训练数据:**训练过程中使用的数据
**假设:**学习模型中关于数据的一般性规律
**学习方法:**学习方法是指根据给定的数据和模型,通过某种策略来调整模型的参数或结构,以使模型能够更好地适应数据,从而实现预测或决策任务。
**监督学习:**给定一组有标记的训练样本,监督学习的任务是学习一个模型,使其能够对新样本进行准确的标记预测。
**无监督学习:**无监督学习的任务是从无标记的数据中发现数据的内在结构和模式,例如聚类任务。
**假设空间:**机器学习算法在学习过程中可以选择的所有可能模型的集合。在假设空间中,每个模型代表了对数据的一种假设或表示。假设空间的选择对于机器学习算法的性能和能力具有重要影响。
泛化:训练的模型能适应新样本的能力
独立同分布:从同一分布中独立地采样得到的随机变量具有相同的分布