Python机器学习（使用sklearn模块）之wine划分，聚类，分类，回归

最新推荐文章于 2025-09-11 14:51:37 发布

原创

最新推荐文章于 2025-09-11 14:51:37 发布 · 1.4w 阅读

114 ·

CC 4.0 BY-SA版权

我这里用的是sklearn自带的数据集中的wine，先提供一下所有需要用到的包吧（如果用的编译器是pycharm，以下所有代码需要放到一起执行）

from sklearn.datasets import load_wine#wine数据集
from sklearn.cluster import KMeans#K-Means聚类模型
from sklearn.model_selection import train_test_split#数据集划分
from sklearn.preprocessing import StandardScaler#标准差标准化
from sklearn.decomposition import PCA#pca降维
from sklearn.linear_model import LinearRegression#线性回归模型
from sklearn.metrics import fowlkes_mallows_score,silhouette_score,accuracy_score,\
    precision_score,recall_score,f1_score,cohen_kappa_score,classification_report,roc_curve,\
    explained_variance_score,mean_absolute_error,mean_squared_error,median_absolute_error,r2_score    #聚类、分类、回归评分标准
from sklearn.svm import SVC#SVM分类模型
import matplotlib.pyplot as plt#数据可视化
import numpy as np#·numpy科学计算包

1.sklearn转换器处理wine数据集

wine = load_wine()
data = wine['data']
target = wine['target']
#数据集划分为训练集，测试集
data_train,data_test,target_train,target_test = train_test_split(

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Wilbur-code

关注关注

11
点赞
踩
114

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Python机器学习】sklearn.datasets分类任务数据集

Mr数据杨

10-20

1348

本文介绍了多个用于分类任务的数据集，包括新闻文本、面部图像、乳腺癌诊断、手写数字识别、鸢尾花分类以及葡萄酒品质评估等。新闻文本数据集（如RCV1）适用于文本分类和多标签分类。面部图像数据集（如LFW和Olivetti）主要用于人脸识别和验证。乳腺癌威斯康星数据集用于医疗诊断，特别是乳腺癌的良性和恶性判断。手写数字数据集（Digits）主要用于图像识别，尤其是数字识别。鸢尾花数据集（Iris）和葡萄酒品质数据集（Wine）适用于自然科学和食品科学领域的分类问题。

【python 机器学习】sklearn数据集的使用

m0_62599305的博客

02-11

828

提供了多个常用的基础数据集，这些数据集适用于不同类型的机器学习任务，包括分类、回归等。通过这些内置数据集，用户可以快速进行机器学习实验，了解数据处理、模型训练、评估等基本过程。本文介绍了Iris、Digits和Breast Cancer数据集的使用方法，通过简单的代码示例，我们演示了如何加载、查看数据并使用基础的分类模型进行训练和评估。掌握这些基础数据集的使用，可以帮助初学者更好地理解机器学习的基本流程，并为更复杂的实际应用打下坚实的基础。

2 条评论您还未登录，请先登录后发表或查看评论

实训 wine数据集_基于wine的K-Means聚类模型研究

weixin_39595310的博客

01-27

4720

摘要：本文通过使用wine数据集来构建K-Means聚类模型，先对wine数据集的原始样本进行数据预处理，得到预处理后的数据作为我们的新数据样本，通过sklearn的估计器接收进行学习的数据用于训练算法，构建聚类模型；完成模型构建对模型进行评价分析，本文具体对FMI评价法、轮廓系数评价法、Calinski-Harabasz指数评价法三种评价方法进行具体的介绍和操作。通过metrics模块提供的聚类...

葡萄酒（WINE）数据集分类（PyTorch实现）

☆下山☆的博客

02-19

7509

葡萄酒（WINE）数据集分类（PyTorch实现）

SciKit-Learn 全面分析分类任务 wine 葡萄酒数据集

最新发布

xchenhao 的博客

09-11

555

本文对葡萄酒数据集（178个样本，13个特征，3个类别）进行了7种分类模型的比较分析。通过标准化预处理后，分别测试了K近邻、决策树、SVM、逻辑回归、随机森林、朴素贝叶斯和MLP模型。结果显示，随机森林和朴素贝叶斯表现最佳，准确率达100%；SVM、逻辑回归和MLP准确率为98.15%；K近邻和决策树为96.30%。ROC曲线分析表明各模型对三类葡萄酒均有良好区分能力，其中随机森林和朴素贝叶斯的AUC值达到1.0，展现出最优的分类性能。该研究为葡萄酒品种识别提供了有效的机器学习方法参考。

用K-Means算法处理wine数据集和wine_quality数据集

m0_61400264的博客

09-12

7343

聚类

Python基于sklearn实现对酒数据集K-means聚类模型、K临近算法模型和SVM分类模型进行建模、评估与数据预测

Jamson

12-15

1万+

Python基于sklearn实现对酒数据集K-means聚类模型、K临近算法模型和SVM分类模型进行建模、评估与数据预测一、下载数据集合数据集网上找一下，此demo只所逻辑参考，数据集标签差异影响不大，对此demo一样实用我用到的csv数据集结构大概如下： Class,Alcohol,Malic_acid,Ash,Alcalinity_of_ash,Magnesium,Total_ph...

Python----数据分析-使用scikit-learn构建模型实训（wine数据集、wine_quality数据）

懂得一千零一种,赋予你失败的方法！

08-14

2万+

Python----数据分析-使用scikit-learn构建模型实训（wine数据集、wine_quality数据）目录：实训1 使用 sklearn处理wine和wine_quality数据集实训2 构建基于wine数据集的k- Means聚类模型实训3 构建基于wine数据集的SVM分类模型实训4 构建基于wine_quality数据集的回归模型 wine数据集包含来自3种不同起源的葡萄酒的共178条记录。13个属性是葡萄酒的13种化学成分。通过化学分析可以来推断葡萄酒的起源。值得一提

机器学习-sklearn-项目学习大全

06-29

scikit-learn（简称sklearn），是基于Python的一个免费软件机器学习库，它提供了简单而有效的工具来进行数据预处理、数据分析以及机器学习任务。sklearn建立在NumPy、SciPy和matplotlib之上，旨在简化机器学习任务，...

[Python从零到壹] 十四.机器学习之分类算法五万字总结全网首发（决策树、KNN、SVM、分类对比实验）

杨秀璋的专栏

07-09

2万+

分类（Classification）属于有监督学习（Supervised Learning）中的一类，它是数据挖掘、机器学习和数据科学中一个重要的研究领域。分类模型类似于人类学习的方式，通过对历史数据或训练集的学习得到一个目标函数，再用该目标函数预测新数据集的未知属性。本章主要讲述分类算法基础概念，并结合决策树、KNN、SVM分类算法案例分析各类数据集，从而让读者学会使用Python分类算法分析自己的数据集，研究自己领域的知识，从而创造价值。 19.1 分类 19.1.1 分类模型与前面讲述的聚类模型类似

【Python】实训6：基于wine和wine_quality数据集练习sklearn构建模型方法（预处理、聚类、分类、回归）

热门推荐

○( ＾皿＾)っHiahiahia…的博客

01-09

4万+

题目来源：《Python数据分析与应用》第6章使用 scikit-learn 构建模型实训部分【黄红梅、张良均主编中国工信出版集团和人民邮电出版社】本博客题目文字主要来自：印象笔记OCR文字识别转换（敲题目是不可能去敲题目的）【OCR （Optical Character Recognition，光学字符识别）】数据集下载链接(下载后找到第6章->实训数据) 实训1 ...

Python Sklearn train_test_split 随机划分训练集和测试集

lyc0424的博客

04-30

1889

sklearn.model_selection.train_test_split随机划分训练集和测试集可以点击官方文档查看一般形式： train_test_split是交叉验证中常用的函数，功能是从样本中随机的按比例选取train data和testdata，形式为： X_train,X_test, y_train, y_test = cross_validation.train_...

机器学习应用——sklearn自带数据集训练（支持向量机分类）

ml_1019的博客

10-20

2380

总地址：git hub ：machine-learning-python 源地址：分類法/範例一: Recognizing hand-written digits1.代码#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2017-10-20 15:19:37 # @Author : VeeL (505220533@qq.com

机器学习Sklearn——红酒分类案例详解决策树模型参数

qq_47250064的博客

08-24

5875

比较细节得讲了决策树的六个参数，一个重要参数，两个随机参数和三个剪枝参数，以及决策树如何让将这个图片导出来。

利用sklearn对红酒数据集分类

我の博客

08-15

1万+

1. sklearn介绍 scikit-learn, 又写作sklearn, 是一个开源的基于python语言的机器学习工具包. 它通过numpy, Scipy和 Matplotlib等python数值计算的库实现的算法应用, 并且涵盖了几乎所有主流机器学习算法. 在工程应用中, 用python手写代码来从头实现一个算法的可能性非常低, 这样不仅耗时耗力, 还不一定能够写出构架清晰, 稳定性强的模型. 更多情况下, 是分析采集到的数据, 根据数据特征选择适合的算法, 在工具包中调用算法, 调整算法的参数

探索sklearn的数据集——以红酒数据集为例

weixin_42969619的博客

08-12

2万+

刚刚使用SKLearn学习机器学习进行数据分析，分享一些概念和想法，希望可以大家一起讨论，如果理解或者表达有不准确的地方，请多多指点，不吝赐教，非常感谢～～在sklearn.datasets库中有非常多的知名数据集，在使用数据集前我总是对数据没有直观了解，所以下面整理一些datasets库中数据集的属性及方法，以红酒数据集为例。随着学习还会持续更新！导入数据集模块并实例化一个数据集 ...

sklearn之svm-葡萄酒质量预测(8)

麦好的AI乐园

10-14

7592

class sklearn.svm.SVC(C=1.0, kernel=’rbf’, degree=3, gamma=’auto_deprecated’, coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_iter=-1, de...

《Sklearn 机器学习模型--分类模型》--K-means 聚类（K-means clustering algorithm）

m0_71002812的博客

05-09

1224

K-means 聚类算法是一种基于划分的无监督学习算法，通过迭代优化将数据划分为指定簇数（K 值），使同一簇内样本相似度最大化、簇间差异最大化。其核心原理是最小化样本到所属簇心的平方误差和（SSE），实现步骤包括初始化、分配样本、更新中心和终止条件。K-means 算法实现简单、计算效率高，适合大规模数据集处理，且结果直观易解释。然而，它需要预先指定 K 值，对初始中心敏感，易陷入局部最优，且仅适用于凸形数据分布。典型应用场景包括工业设备检测、能源优化调度和通用数据分组（如图像分割、用户分群和异常检测）。改

sklearn 的使用

新博客：https://aping-dev.com/

02-12

589

from sklearn import datasets wine = datasets.load_wine() # 导入数据 X = wine.data # 特征向量 Y = wine.target # 标签 import numpy as np print(np.shape(X), np.shape(Y)) (178, 13) (178,) # 把数据分成训练数据和测试数据 fr...

探索加州红酒数据集：使用sklearn进行机器学习分析

常见的机器学习任务包括分类、回归、聚类、强化学习等。 3. 酒数据集: 酒数据集源自加州大学机器学习库，包含了1599种不同红酒的11种物理化学属性。这些属性包括固定酸度、挥发性酸度、柠檬酸、残留糖分、氯化物、...