scikit-learn 学习总结 (一)——sklearn实现感知机(perceptron)

本文介绍了使用scikit-learn库训练感知机模型的过程,包括特征选择、数据预处理、训练集与测试集划分、特征标准化及模型性能评估。文章详细阐述了训练感知机的步骤,如`train_test_split`函数的应用,以及如何通过`StandardScaler`进行特征标准化。同时,讨论了模型的准确率作为性能指标,并指出感知机仅适用于线性可分数据,对于非线性数据则需采用其他分类方法,如逻辑回归。
摘要由CSDN通过智能技术生成

学习《python machine learning》 的第三章,A Tour of Machine Learning Classifiers Using scikit-learn

本章主要讲述 特征选择 和 数据预处理,以下算法实现都是基于sklearn的接口~~~~

生命不息,学习不止~ 哈哈哈哈

【训练一个机器学习模型的五大关键步骤:】

(1)选择特征,收集训练样本

(2)选择性能指标

(3)选择分类器和优化算法

(4)评估模型性能

(5)调整算法(调参)

【training a percetron】

sklearn中自带了一些数据集,比如iris数据集,Iris数据中data存储花瓣长宽(column0,1)和花萼长宽(column2,3).

target存储花的分类,Iris-setosa , Iris-versicolor , and Iris-virginica ,分别存储为数字 0,1,2

【收集训练样本】

from sklearn import datasets
import numpy as np

iris = datasets.load_iris()
X = iris.data[:,[2, 3]]
y = iris.target
print(np.unique(y))

【  train_test_split   分为训练集和测试集】

train_test_split 将数据集分为训练集和测试集,test_size参数决定测试集的比例。

random_state参数是随机数生成种子,在分类前将数据打乱,保证数

  • 4
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值