主要符号表
样本空间:以样本的属性为坐标轴张成的多维空间,也叫属性空间、输入空间
概率分布:表示随机变量取值的概率规律,随机试验的概率分布即随机变量的概率分布
假设空间:由输入空间到输出空间的映射的集合,即模型的集合
版本空间:用训练集对假设空间进行匹配,即能对训练集中的样本进行正确预测的假设集合
概率质量函数:离散随机变量在各特定取值上的概率的函数
概率密度函数:连续随机变量在某个确定的取值点附近的概率的函数
向量范数和矩阵范数:https://zhuanlan.zhihu.com/p/35897775
数据集/样本:一组记录的集合
示例instance/样本:其中每条记录是关于一个事件或对象(西瓜)的描述,一个样本对应一个特征向量feature vector
属性attribute/特征feature:反映事件或对象在某方面的表现或性质,其值为属性值
属性空间/样本空间/输入空间:属性张成的空间
维数dimensionality:样本的属性个数称为样本的维数
学习/训练:用某个学习算法从数据中得到模型/学习器learner/假设hypothesis
训练数据:训练过程中用到的数据
训练样本:训练用的每个样本,样本是样本空间的采样,样本是样本的采样
训练集:训练样本组成的集合
ground-truth:有监督的机器学习中被正确打标记的训练数据
标