高维数据可视化

最新推荐文章于 2022-09-25 17:05:08 发布

齐卡卡西

最新推荐文章于 2022-09-25 17:05:08 发布

阅读量1.3k

点赞数

分类专栏： python 数据可视化文章标签：机器学习

本文链接：https://blog.csdn.net/qq_42935317/article/details/112345047

版权

python 同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

数据可视化

2 篇文章 0 订阅

订阅专栏

Machine learning code

$\color{BLUE}{数据可视化}$

我是机器学习的初学者，最近在师兄的指导下，进行数据的降维可视化，因为对这些问题不是很透彻，为方便自己和大家，我写的尽量详细

基于PCA的数据降维，并且作图：
首先说明，数据格式data.shape= [5,24,10,10] ,数据共分为5类，每类数据有10个样本数据。在降维之前要把所有的数据reshape一下，因为可视化要求输入的数据，必须是二维数据。
设输入的初始机器学习数为data
（1）获取降维之前的机器学习数据data

（2）将data降维到二维

data = data.reshape(50 ,-1)

(3)准备数据标签，我的数据是按照顺序排列的，因此使用以下语句进行
其排列方式为10个0，10个1，10个2，10个3，10个4.

arr1 = np.full(10,0)
arr2 = np.full(10,1)
arr3 = np.full(10,2)
arr4 = np.full(10,3)
arr5 = np.full(10,4)
labels = np.concatenate( (arr1, arr2,arr3,arr4,arr5))

(4)准备数据标签，我的数据是按照顺序排列的，因此使用以下语句进行

from sklearn.decomposition import PCA
pca = PCA(n_components=0.95)# 保证降维后的数据保持95%的信息
result = pca.fit(data)

(5)做出PCA可视化后的图

 plt.figure(figsize=(8, 6))
dict ={ 0:'label0',   1: 'label1',   2: 'label2',   3 :' label3',   4 :  'label4'}
for i in range (5):
    plt.scatter(y[(i+0)*10:(i+1)*10,0], y[(i+0)*10:(i+1)*10:,1], label = dict[i],s=100)
   #s 代表散点的大小
plt.legend(fontsize = 15,frameon = True,loc="lower right")	 #图例字体大小，有边框， 右下角
plt.tick_params(labelsize=20)				#刻度字体大小
matplotlib.rcParams['xtick.labelsize'] = 15
matplotlib.rcParams['ytick.labelsize'] = 15
matplotlib.rcParams['axes.labelsize'] = 40
plt.savefig("PCA.png" , dpi=300) 
#plt.show()

（6）效果展示

作图效果实现

齐卡卡西

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
高维数据可视化

Machine learning code数据可视化\color{BLUE}{数据可视化}数据可视化我是机器学习的初学者，最近在师兄的指导下，进行数据的降维可视化，因为对这些问题不是很透彻，为方便自己和大家，我写的尽量详细基于PCA的数据降维，并且作图：        首先说明，数据格式data.shape= [5,24,10,10] ,数据共分为5类，每类数据有10个样本数据。在降维之前要把所有的数据reshape一下
复制链接

扫一扫