python Isomap函数数据降维

模型原型

class sklearn.manifold.Isomap(n_neighbors=5,n_components=2,eigen_solver=’auto’,tol=0,max_iter=300,path_method=’auto’,neighbors_algorithm=’auto’)

参数

n_neighbors:近邻参数k
n_components:指定低维的维数
eigen_solver:指定求解特征值的算法
	’auto’:由算法自动选取
	‘arpack’:Arpack分解算法
	‘dense’:使用一个直接求解特征值的算法(如LAPACK)
tol:求解特征算法的收敛阙值
max_iter
path_method:指定寻找最短路径的算法
	’auto’:由算法自动选取
	‘FW’:使用Floyd_Warshall算法
	‘D’:使用Dijkstra算法
neighbors_algorithm:指定计算最近邻的算法
	’ball_tree’:使用BallTree算法
	‘kd_tree’:使用KDTree算法
	‘brute’:使用暴力搜索法

属性

- embedding_
- trainingdata:存储了原始训练数据
- distmatrix:存储了原始训练数据的距离矩阵

方法

- fit(X[,y,init])
- transform(X):转换X到低维空间
- fit_transform(X,[,y]):训练模型并将原始数据集转换到低维坐标
- reconstruction_error():计算重构误差

导入包

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets,decomposition,manifold

加载数据

def load_data():
    iris=datasets.load_iris()
    return iris.data,iris.target

使用类

def test_Isomap(*data):
    X,y=data
    for n in [4,3,2,1]:
        isomap=manifold.Isomap(n_components=n)
        isomap.fit(X)
        print('reconstruction_error(n_components=%d):%s'%(n,
            isomap.reconstruction_error()))
X,y=load_data()
test_Isomap(X,y)

降维后的样本分布图

def plot_Isomap(*data):
    X,y=data
    Ks=[1,5,25,y.size-1]
    fig=plt.figure()
    for i,k in enumerate(Ks):
        isomap=manifold.Isomap(n_components=2,n_neighbors=k)
        X_r=isomap.fit_transform(X)
        ax=fig.add_subplot(2,2,i+1)
        colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
               (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)
        for label,color in zip(np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position,0],X_r[position,1],label='target=%d'%label,color=color)
        ax.set_xlabel('X[0]')
        ax.set_ylabel('X[1]')
        ax.legend(loc='best')
        ax.set_title("k=%d"%k)
    plt.suptitle('Isomap')
    plt.show()

plot_Isomap(X,y)

将原始数据的特征直接压缩到一维

def plot_Isomap_k_d1(*data):
    X,y=data
    Ks=[1,5,25,y.size-1]
    fig=plt.figure()
    for i,k in enumerate(Ks):
        isomap=manifold.Isomap(n_components=2,n_neighbors=k)
        X_r=isomap.fit_transform(X)
        ax=fig.add_subplot(2,2,i+1)
        colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
               (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)
        for label,color in zip(np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position],np.zeros_like(X_r[position]),label='target=%d'%label,color=color)
        ax.set_xlabel('X[0]')
        ax.set_ylabel('Y')
        ax.legend(loc='best')
        ax.set_title("k=%d"%k)
    plt.suptitle('Isomap')
    plt.show()

plot_Isomap_k_d1(X,y)
  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
ISOMAP是一种流形学习的算法,用于高维数据降维。下面是一个Python函数,可以实现ISOMAP算法的降维过程: ```python import numpy as np from sklearn.neighbors import NearestNeighbors from scipy.sparse import csgraph def isomap(X, n_components, n_neighbors): """ ISOMAP算法的降维过程 Parameters: ---------- X : array-like, shape (n_samples, n_features) 高维数据矩阵 n_components : int 降维后的维数 n_neighbors : int K近邻的数量 Returns: ------- X_iso : array-like, shape (n_samples, n_components) 降维后的数据矩阵 """ # Step 1: 计算距离矩阵 knn = NearestNeighbors(n_neighbors=n_neighbors+1).fit(X) dist, indices = knn.kneighbors(X) dist = dist[:, 1:] indices = indices[:, 1:] # Step 2: 构造连通图 graph = np.zeros((X.shape[0], X.shape[0])) for i in range(X.shape[0]): graph[i, indices[i]] = dist[i] graph[indices[i], i] = dist[i] # Step 3: 计算最短路径距离 shortest_path = csgraph.shortest_path(graph) # Step 4: 计算中心化距离矩阵 G = shortest_path ** 2 G -= G.mean(axis=0) G -= G.mean(axis=1) G += G.mean() # Step 5: 特征值分解 eig_val, eig_vec = np.linalg.eig(G) indices = np.argsort(eig_val)[:n_components] eig_vec = eig_vec[:, indices] # Step 6: 降维 X_iso = np.dot(eig_vec, np.diag(np.sqrt(eig_val[indices]))) return X_iso ``` 函数中使用了scikit-learn库中的`NearestNeighbors`类来计算K近邻,使用了SciPy库中的`csgraph.shortest_path`函数来计算最短路径距离,使用了NumPy库中的`np.linalg.eig`函数来进行特征值分解。最后,根据降维后的维数和特征向量来计算降维后的数据矩阵。 使用示例: ```python import pandas as pd from sklearn.datasets import load_iris import matplotlib.pyplot as plt # 加载数据 iris = load_iris() X = iris.data y = iris.target # 调用ISOMAP函数进行降维 X_iso = isomap(X, n_components=2, n_neighbors=5) # 绘制降维后的散点图 plt.scatter(X_iso[:, 0], X_iso[:, 1], c=y) plt.show() ``` 以上代码将会对Iris数据集进行ISOMAP降维,并绘制降维后的散点图。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值