scikit-learn 机器学习介绍

最新推荐文章于 2024-05-31 23:57:57 发布

Nautilus_sailing

最新推荐文章于 2024-05-31 23:57:57 发布

阅读量936

点赞数

分类专栏： Python科学计算文章标签：机器学习数据算法压缩预测

本文链接：https://blog.csdn.net/baidu_38060633/article/details/69788122

版权

一机器学习问题
二加载示例数据集
- 鸢尾花卉数据集
- 手写数字数据集
三学习与预测
四回归
五分类
六聚类
- 图像压缩
七降维

一、机器学习问题

scikit-learn 是一个比较流行的开源机器学习库。它支持许多分类，回归，聚类算法，包括支持向量机，逻辑回归，朴素贝叶斯，随机森林，梯度boosting，k-means 和 DBSCAN，并且可以与 Numpy 与 SciPy 库进行交互。

二、加载示例数据集

鸢尾花卉数据集

安德森鸢尾花卉数据集是一类多重变量分析的数据集，其数据集包含了150个样本，都属于鸢尾属下的三个亚属，分别是山鸢尾、变色鸢尾和维吉尼亚鸢尾。四个特征被用作样本的定量分析，它们分别是花萼和花瓣的长度和宽度。

from sklearn import datasets
iris = datasets.load_iris()

#数据存储在 .data 成员中，它是一个 (n_samples, n_features) numpy 数组
iris.data.shape
=>(150, 4)

#一个样本的类别存储在 .target 属性中，它是一个一维数组
iris.target.shape
=>(150,)

#显示数据集中有哪些类别
import numpy as np
np.unique(iris.target)
=>
array([0, 1, 2])        #共三类，分别用 0，1,2 表示

手写数字数据集

手写数字数据集包含了来自 44 个作者的 250 个样本，通常被用作手写数字预测。

#加载数据集
digits = datasets.load_digits()

#查看底层数据
print(digits.data)

#查看数据集目标值
digits.target

三、学习与预测

以使用手写数字数据集做数字识别为例, 需要将评估函数与数据进行拟合来进行预测。在 scikit-learn 中，评估函数（estimator）是一个 Python 对象，它实现了 fit(X, y) 与 predict(T) 方法。

#类 sklearn.svm.

最低0.47元/天解锁文章

Nautilus_sailing

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn 机器学习介绍

一机器学习问题二加载示例数据集鸢尾花卉数据集手写数字数据集三学习与预测四回归五分类六聚类图像压缩七降维一、机器学习问题scikit-learn 是一个比较流行的开源机器学习库。它支持许多分类，回归，聚类算法，包括支持向量机，逻辑回归，朴素贝叶斯，随机森林，梯度boosting，k-means 和 DBSCAN，并且可以与 Numpy 与 SciPy 库进行交互。二、加载示例数据集鸢
复制链接

扫一扫