首先,你需要导入必要的库,比如 NumPy 和 Scikit-learn。然后,你需要加载数据集。这可以通过使用 Scikit-learn 的 fetch_lfw_people 函数来实现。
import numpy as np
from sklearn.datasets import fetch_lfw_people
# 加载数据集
data = fetch_lfw_people(min_faces_per_person=20, resize=0.7)
X = data['data']
y = data['target']
target_names = data['target_names']
# 显示数据集的大小
print(f"X.shape: {X.shape}")
print(f"y.shape: {y.shape}")