scikit-learn 学习总结（一）——sklearn实现感知机（perceptron）

最新推荐文章于 2024-07-21 01:39:27 发布

Amy_mm

最新推荐文章于 2024-07-21 01:39:27 发布

阅读量8.7k

点赞数 4

分类专栏： python sklearn 机器学习

本文链接：https://blog.csdn.net/Amy_mm/article/details/79722685

版权

本文介绍了使用scikit-learn库训练感知机模型的过程，包括特征选择、数据预处理、训练集与测试集划分、特征标准化及模型性能评估。文章详细阐述了训练感知机的步骤，如`train_test_split`函数的应用，以及如何通过`StandardScaler`进行特征标准化。同时，讨论了模型的准确率作为性能指标，并指出感知机仅适用于线性可分数据，对于非线性数据则需采用其他分类方法，如逻辑回归。

摘要由CSDN通过智能技术生成

学习《python machine learning》的第三章，A Tour of Machine Learning Classifiers Using scikit-learn

本章主要讲述特征选择和数据预处理，以下算法实现都是基于sklearn的接口~~~~

生命不息，学习不止~ 哈哈哈哈

【训练一个机器学习模型的五大关键步骤：】

（1）选择特征，收集训练样本

（2）选择性能指标

（3）选择分类器和优化算法

（4）评估模型性能

（5）调整算法（调参）

【training a percetron】

sklearn中自带了一些数据集，比如iris数据集，Iris数据中data存储花瓣长宽（column0,1）和花萼长宽（column2,3）.

target存储花的分类，Iris-setosa , Iris-versicolor , and Iris-virginica ，分别存储为数字 0,1,2

【收集训练样本】

from sklearn import datasets
import numpy as np

iris = datasets.load_iris()
X = iris.data[:,[2, 3]]
y = iris.target
print(np.unique(y))

【 train_test_split 分为训练集和测试集】

train_test_split 将数据集分为训练集和测试集，test_size参数决定测试集的比例。

random_state参数是随机数生成种子，在分类前将数据打乱，保证数

最低0.47元/天解锁文章

Amy_mm

关注

4
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn 学习总结（一）——sklearn实现感知机（perceptron）

学习《python machine learning》的第三章，A Tour of Machine Learning Classifiers Using scikit-learn本章主要讲述特征选择和数据预处理，以下算法实现都是基于sklearn的接口~~~~生命不息，学习不止~ 哈哈哈哈【训练一个机器学习模型的五大关键步骤：】（1）选择特征，收集训练样本（2）选择性能...
复制链接

扫一扫