文章目录
高维数据与维度灾难
大多数机器学习和数据挖掘技术对于高维数据可能不太有效。这是由于维度灾难(Curse of Dimensionality)导致的。
随着维度的增加,查询的准确性和效率会迅速下降。因此,在高维数据中,许多机器学习和数据挖掘技术可能无法处理。
然而,高维数据的内在维度可能很小。例如,在某种类型的疾病中负责的基因数量可能很少。因此,对于高维数据,需要使用专门针对高维数据的技术,如降维和特征选择,以提高机器学习和数据挖掘的效率和准确性。
维度灾难
在高维数据中,维度灾难(Curse of Dimensionality)会导致以下问题:
- 随着维度的增加,数据在所占用的空间中变得越来越稀疏。
- 密度和点之间的距离的定义对于聚类和异常检测变得越来越无意义。
- 如果 N 1 =