pca 因子分析 lda tsne做数据降维效果比较

用鸢尾花的4维数据,尝试不同的降维方式,观察变为两维数据后的效果

#!/usr/bin/python
# -*- coding:utf-8 -*-
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.decomposition import FactorAnalysis
from sklearn import metrics

if __name__ == "__main__":
    mpl.rcParams['font.sans-serif'] = [u'SimHei']
    mpl.rcParams['axes.unicode_minus'] = False

    iris_feature = '花萼长度', '花萼宽度', '花瓣长度', '花瓣宽度'
    path = 'iris.data'  # 数据文件路径
    data = pd.read_csv(path, header=None)
    x_prime = data.iloc[:,0:3]
    y = pd.Categorical(data[4]).codes
    from sklearn.decomposition import PCA
    from sklearn.manifold import TSNE

    pca = PCA(n_components=2)
    titles = ['原始数据','PCA','因子分析','tsne','lda']
    fa = FactorAnalysis(n_components=2)
    tsne = TSNE(n_components=2)
    from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
    lda = LinearDiscriminantAnalysis(n_components=2)
    model = [pca,fa,tsne,lda]
    plt.figure(figsize=(10,10))
    for i in [1,2,3,4,5]:
        plt.subplot(2,3,i)
        if i == 1:
            plt.scatter(x_prime.iloc[:, 0], x_prime.iloc[:, 1], c=y)
        elif i ==5:
            X_new = model[i - 2].fit_transform(x_prime,y)
            plt.scatter(X_new[:, 0], X_new[:, 1], c=y)
        else:
            X_new = model[i-2].fit_transform(x_prime)
            plt.scatter(X_new[:, 0], X_new[:, 1], c=y)
        plt.title(titles[i-1])
    plt.show()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值