matplotlib
plt.rcParams['axes.labelsize'] = 14
plt.rcParams['xtick.labelsize'] = 12
plt.rcParams['ytick.labelsize'] = 12
plt.rcParams['axes.labelsize'] = 14
:设置图表的坐标轴标签的字体大小为14。plt.rcParams['xtick.labelsize'] = 12
:设置图表的X轴刻度标签的字体大小为12。plt.rcParams['ytick.labelsize'] = 12
:设置图表的Y轴刻度标签的字体大小为12。
import warnings
warnings.filterwarnings('ignore')
warnings.filt
erwarnings('ignore')
:忽略警告,即不显示警告信息。
Numpy
np.random.seed(42)
np.random.seed(42)
指定了随机数生成器的种子为 42。种子是一个起始值,它确定了随机数生成器将生成的随机数序列。
种子的作用在于当使用相同的种子时,每次运行生成的随机数序列都是一样的。这在需要重现实验结果或确保随机性一致性的情况下非常有用。我们可以确保每次运行时产生的随机数都是相同的,从而有助于比较和调试
shuffle_index = np.random.permutation(60000)
X_train, y_train = X_train[shuffle_index], y_train[shuffle_index]
使用了 NumPy 的 random.permutation()
函数来对 X_train
和 y_train
进行重排列(随机打乱顺序)。
shuffle_index = np.random.permutation(60000)
:创建一个形状为(60000,)
的随机排列数组shuffle_index
,其中包含了从 0 到 59999 的随机排列的整数。X_train[shuffle_index]
:使用shuffle_index
数组中的索引,对X_train
数组进行重排列操作。这将返回一个新的数组,其中包含了X_train
数组按照shuffle_index
的顺序重新排列后的值。即,原来的X_train
数组中的行将按照shuffle_index
中的顺序重新排列。y_train[shuffle_index]
:与上一步类似,对y_train
数组进行重排列操作。
sklearn
from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784', parser = 'auto')
Fetch dataset from openml by name or dataset id. 通过名字和数据集id从openml 获取数据集