【sklearn的一般流程】sklearn的一般流程，以鸢尾花分类为例

最新推荐文章于 2024-05-14 14:50:41 发布

carry_1024

最新推荐文章于 2024-05-14 14:50:41 发布

阅读量2.1k

点赞数 3

分类专栏： sklearn的一般流程机器学习文章标签： sklearn SVM 模型评分模型优化模型选择

本文链接：https://blog.csdn.net/ycarry2017/article/details/85053217

版权

【sklearn的一般流程】sklearn的一般流程，以鸢尾花分类为例

1. 数据的获取
2. 数据预处理
- - - 特征缩放
    - 切割训练集和测试集
3.训练模型
4.模型的评估
5.模型的优化
6.模型持久化
- - - pickle
    - joblib

1. 数据的获取

sklearn是个非常强大的工具库，它自带了很多数据集，我们用iris（鸢尾花）作为本次的数据集。
sklearn自带的数据集
我们先把标准库导入，再调用sklearn的datasets函数导入iris数据集

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 1.get the dataset
from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target

iris：我们获取到的iris数据集是一个bunch格式（可以直接理解为字典）

X：特征值，共4种样例：sepal length (cm)，sepal width (cm)，petal length (cm)，petal width (cm)。其值均为数字。

y：标签，共有3种分类：setosa，versicolor，virginica。其值分别以0，1，2表示。
如图所示：

2. 数据预处理

特征缩放

我们可以观察到X的值之间相差比较大，为了能够得到更好的分类效果，我们采用特征缩放对数据进行处理。这里用到的是MinMaxScaler，特征缩放的其他方式。

from sklearn.p

最低0.47元/天解锁文章

carry_1024

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
【sklearn的一般流程】sklearn的一般流程，以鸢尾花分类为例

【机器学习个人笔记】sklearn的一般流程，以鸢尾花分类为例1. 数据的获取2. 数据预处理特征缩放切割训练集和测试集3.训练模型4.模型的评估查看参数 get_params()查看模型评分 score(X_test, y_test)查看分类模型的评分报告 classification_report()用交叉验证评分 cross_val_score5.模型的优化1. 数据的获取sklearn...
复制链接

扫一扫

专栏目录