流形学习——ISOMAP算法
Isomap(Isometric Feature Mapping)是流行学习的一种,用于非线性数据降维,是一种无监督算法.
流形
流形是一个局部具有欧式空间性质的拓扑空间,流形能很好地近似任意高维的子空间.
测地线距离
测地距离(Geodesic Distance),在高维空间中度量距离不应当直接使用欧式距离,而应当使用测地距离.
测地线距离定义
- 邻近的点:输入空间的欧式距离提供一个测地线距离的近似.
- 最远的点:测地线距离通过一些列邻域点之间的欧式距离的累加近似得到.
举例: 在一个流形中,相距很远的两个点,有可能欧式距离很近.
ISOMAP算法
ISOMAP(Isometric Feature Mapping, 等距离特征映射),是一种非线性降维方法,其基于度量MDS,试图保留数据内在的由测地线距离蕴含的几何结构.
算法步骤
- 构建邻接图
- 通过连接距离小于 ϵ \epsilon ϵ的两个点 i i i和 j j j在N个数据点上定义图 G G G( ϵ − I s o m a p \epsilon-Isomap ϵ−Isomap),或者点 i i i是点 j j j的 k k k近邻之一(K-Isomap).
- 设置边的长度为