PCA-小麦分类预处理之降维

最新推荐文章于 2022-09-06 21:19:28 发布

小王王王旺

最新推荐文章于 2022-09-06 21:19:28 发布

阅读量368

点赞数

分类专栏： Python机器学习和图像处理实战文章标签： python

本文链接：https://blog.csdn.net/qq_44705877/article/details/120854378

版权

Python机器学习和图像处理实战专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文展示了如何利用Python的PCA算法将小麦数据集中的特征降低到二维，通过Logistic回归并结合Scikit-learn库，实现数据标准化和降维操作，最终通过可视化展示不同类别样本在降维后的分布。

摘要由CSDN通过智能技术生成

用PCA将小麦的数据降维到二维

from sklearn.decomposition import PCA
from sklearn.linear_model import LogisticRegression
import matplotlib.pyplot as plt
import numpy 
import pandas as pd

fp=open('seeds_dataset.txt','r')
ls=[]
for line in fp:
    line=line.strip('\n')   #将\n去掉
    ls.append(line.split('\t'))   #将空格作为分隔符将一个字符切割成一个字符数组

fp.close()
ls=numpy.array(ls,dtype=float)   #将其转换成numpy的数组，并定义数据类型为float
print(ls)

# 将文件转为DataFrame表格
ls_pd = pd.DataFrame(ls)

ls_pd.loc[:,1:6]

y = ls_pd.loc[:,7]

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
data_std = sc.fit_transform(ls_pd.loc[:,1:6])

pca = PCA(n_components = 2) #加载PCA算法，设置降维后主成分数目为2
reduced_x = pca.fit_transform(data_std) #对样本进行降维

reduced_x

red_x,red_y=[],[]
blue_x,blue_y=[],[]
green_x,green_y=[],[]


for i in range(len(reduced_x)):
    if y[i] == 1:
        red_x.append(reduced_x[i][0])
        red_y.append(reduced_x[i][1])

    elif y[i] == 2:
        blue_x.append(reduced_x[i][0])
        blue_y.append(reduced_x[i][1])

    else:
        green_x.append(reduced_x[i][0])
        green_y.append(reduced_x[i][1])

#可视化
plt.scatter(red_x,red_y,c='r',marker='x')
plt.scatter(blue_x,blue_y,c='b',marker='D')
plt.scatter(green_x,green_y,c='g',marker='.')
plt.show()

结果如下：
在这里插入图片描述

小王王王旺

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
PCA-小麦分类预处理之降维

用PCA将小麦的数据降维到二维from sklearn.decomposition import PCAfrom sklearn.linear_model import LogisticRegressionimport matplotlib.pyplot as pltimport numpy import pandas as pdfp=open('seeds_dataset.txt','r')ls=[]for line in fp: line=line.strip('\n')
复制链接

扫一扫

专栏目录