Sklearn 决策树
笔记链接:决策树笔记
使用PCA对数据进行降维并可视化
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
iris = load_iris()
y = iris.target
# x是4维数据 (150, 4)
x = iris.data
x_dr = PCA(2).fit_transform(x) # 将x降为两维
# print(x_dr)
# 布尔索引,不懂自己去google
# y==0返回的是一个和y一样大小的矩阵,其中==0的为true否则为false
plt.figure()
plt.scatter(x_dr[y == 0, 0], x_dr[y == 0, 1], c='red', label=iris.target_names[0])
plt.scatter(x_dr[y == 1, 0], x_dr[y == 1, 1], c='black', label=iris.target_names[1])
plt.scatter(x_dr[y == 2, 0], x_dr[y == 2, 1], c='orange', label=iris.target_names[2])
plt.legend()
plt.title('PCA of iris dataset')
plt.show()
结果如下,可以清晰的看出三种花的分类情况