机器学习常用术语
1. 维度灾难(Curse of Dimensionality)
1.1 数据稀疏性(Data Sparsity)
试想一下,如果有一个分类类别为n的训练任务,当样本数据只有1个维度,只需要m个样本就可以很好地cover这个问题;而当维度增加到2时,为了实现样本的充分覆盖,可能就需要 m 2 m^2 m
试想一下,如果有一个分类类别为n的训练任务,当样本数据只有1个维度,只需要m个样本就可以很好地cover这个问题;而当维度增加到2时,为了实现样本的充分覆盖,可能就需要 m 2 m^2 m