Python机器学习：KNN算法03训练数据集，测试数据集train test split

最新推荐文章于 2022-11-01 22:52:12 发布

VIP文章范德彪陕西分彪

最新推荐文章于 2022-11-01 22:52:12 发布

阅读量3.4k

点赞数 2

分类专栏： Python机器学习

本文链接：https://blog.csdn.net/weixin_46815330/article/details/110389874

版权

示例代码
首先引入相关包

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
import pandas as pd

下载鸢尾花数据集

iris = datasets.load_iris()

print(type(iris))

<class 'sklearn.utils.Bunch'>

数据和数据类别

X = iris.data
y = iris.target

print(X.shape)
print(y.shape)

在这里插入图片描述
train_test_split

#train_test_split
#y是排好序的，前50个是0，中间50个是1，后面50个是2
#将原始数据打乱随机化,X,y分离..他们之间有对应关系
#第一种方式把X,y合并然后打乱,然后拆分（有时间试验试一下）
#我们使用第二种
#随机索引
shuffle_index = np.random.permutation(len(X))
print(shuffle_index)

输出结果

[ 30  22  56  92  55   2  85 118   5  60  36  33  81  75  83 117  12  80
 128  19 105  42  98  69  68  35  20   0  88  38  65 149  58 119  45  48
 109  43 113  79 114  29  74  90  11  91 124  57 148 130  63 129 139  17
  32  93  40   7 146  21 136   8  16 127 140  62  13  14  59 121   4  54
  49  41 132  67 110  64  78 137  24  97 122  47 108   1  28  61  82  86
 111 116  87  72 101

最低0.47元/天解锁文章

范德彪陕西分彪

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
Python机器学习：KNN算法03训练数据集，测试数据集train test split

示例代码首先引入相关包import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsimport pandas as pd下载鸢尾花数据集iris = datasets.load_iris()print(type(iris))<class 'sklearn.utils.Bunch'>数据和数据类别X = iris.datay = iris.targetprint(X.s
复制链接

扫一扫