使用步骤
1.导入相关包:
from sklearn.datasets import load_iris
from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
2.实例化对象:li = load_iris() 返回一个字典格式的数据
3.#获取特征值 , 也就是数据: print(li.data) #因为是字典也可以li[‘data’]
4. #获取目标值:print(li.target)
5. 获取描述信息: print(li.DESCR)
结果
1.数据输出
2.目标输出
其中0 1 2 分别代表花的类别
3.获取描述信息
这里选择几个比较常用的加以说明:
Attribute Information:表示数据的列索引
class:表示类别,这里有三类,分别对应于目标输出中的0 1 2 三类
进行数据划分
```python
#必须这样排列
x_train,x_test,y_train,y_test = train_test_split(li.data,li.target,test_size=0.25)
#li.data,表示总数据,也及要划分的数据集
#li.target,表示数据集的目标值
#test_size = 0.25,表示测试集的大小,范围0-1
#注意这里进行划分是随机抽取
print("训练集特征值和目标值:",x_train,y_train)
print("测试集特征值和目标值:",x_test,y_test)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210123093453348.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210123093515876.png)