IRIS数据集是一个常用的机器学习数据集,其中包含了150个样本,每个样本有4个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。本文将介绍如何使用Python和Scikit-learn库将IRIS数据集转换为只包含两个特征的数据集,以便于可视化和降低计算复杂度。
首先,我们需要导入所需的库和IRIS数据集。确保已安装Scikit-learn库,并从该库中导入load_iris
函数和train_test_split
函数。
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
接下来,我们可以使用load_iris
函数加载IRIS数据集。这个函数会返回一个对象,其中包含特征数据和标签数据。
iris = load_iris()
X = iris