示例代码
首先引入相关包
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
import pandas as pd
下载鸢尾花数据集
iris = datasets.load_iris()
print(type(iris))
<class 'sklearn.utils.Bunch'>
数据和数据类别
X = iris.data
y = iris.target
print(X.shape)
print(y.shape)
train_test_split
#train_test_split
#y是排好序的,前50个是0,中间50个是1,后面50个是2
#将原始数据打乱随机化,X,y分离..他们之间有对应关系
#第一种方式把X,y合并然后打乱,然后拆分(有时间试验试一下)
#我们使用第二种
#随机索引
shuffle_index = np.random.permutation(len(X))
print(shuffle_index)
输出结果
[ 30 22 56 92 55 2 85 118 5 60 36 33 81 75 83 117 12 80
128 19 105 42 98 69 68 35 20 0 88 38 65 149 58 119 45 48
109 43 113 79 114 29 74 90 11 91 124 57 148 130 63 129 139 17
32 93 40 7 146 21 136 8 16 127 140 62 13 14 59 121 4 54
49 41 132 67 110 64 78 137 24 97 122 47 108 1 28 61 82 86
111 116 87 72 101