不能错过！初学者三种类型机器学习必看指南

最新推荐文章于 2023-10-16 09:27:25 发布

「已注销」

最新推荐文章于 2023-10-16 09:27:25 发布

阅读量956

点赞数 1

分类专栏：热点文章 AI 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/103236483

版权

本文介绍了机器学习的三种主要类型：监督学习（分类、回归）和无监督学习（聚类）。通过Python的scikit-learn库展示了分类问题中的葡萄酒数据集和回归问题中的波士顿房价数据集，使用了多种算法进行模型选择。无监督学习部分探讨了K-means聚类，并利用Yellowbrick库进行可视化以确定最佳聚类数。

摘要由CSDN通过智能技术生成

全文共5835字，预计学习时长16分钟

用Yellowbrick可视化KMeans

机器学习问题一般可以分为三种类型，包括被称为监督学习的分类和回归，和无监督学习，无监督学习在机器学习中通常是指聚类。

本文将简要介绍这三个问题，并在流行的python库scikit-learn中演练。

在开始之前，先简要解释监督和无监督学习术语的含义。

监督学习:在监督学习中，有一组已知的输入（特征）和一组已知的输出（标签）。一般把输入特征和输出标签叫做X和y。该算法的目标是学习将输入映射到输出的映射函数。从而当给出新的X示例时，该机器可以正确地预测相应的y标签。

无监督学习:在无监督的学习中，只有一组输入（X），没有对应的标签（y）。该算法的目的是在数据中找到之前未发现的规律。这些算法常常被用来寻找X的类似样本的有意义的聚类，因此实际上可以找到数据的内在类别。

图源：pexels

1. 分类

在分类中，输出(y)是类别。类别可以只有两种，比如说可以把邮件分成垃圾邮件和非垃圾邮件。类别也可以有很多种，例如对花的种类进行分类，这被称为多类分类。

接下来用scikit-learn来举一个关于分类的简单例子。如果您尚未安装scikit-learn，可以通过pip或conda安装。

Scikit-learn有许多可以通过库直接访问的数据集。在本文中为了方便，整个过程中使用的数据集都是这些示例数据集。下面使用属于多类分类的葡萄酒数据集来说明分类问题。在数据集中，输入（X）包含13个与每种葡萄酒类型的各种属性相关的特征。已知的输出（y）是数据集中已经给出的用数字0，1或2代表的葡萄酒类型。

本文中使用的所有代码的导入如下所示。

import pandas as pd

import numpy as npfrom sklearn.datasets import load_wine

from sklearn.datasets import load_bostonfrom sklearn.model_selection importtrain_test_split

from sklearn import preprocessingfrom sklearn.metrics import f1_score

from sklearn.metrics import mean_squared_error

from math import sqrtfrom sklearn.neighbors import KNeighborsClassifier

from sklearn.svm import SVC, LinearSVC, NuSVC

from sklearn.tree import DecisionTreeClassifier

from skle

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
不能错过！初学者三种类型机器学习必看指南

全文共5835字，预计学习时长16分钟用Yellowbrick可视化KMeans机器学习问题一般可以分为三种类型，包括被称为监督学习的分类和回归，和无监督学习，无监督学习在机器学习中通常是指聚类。本文将简要介绍这三个问题，并在流行的python库scikit-learn中演练。在开始之前，先简要解释监督和无监督学习术语的含义。监督学习:在监督学习中，有一组已知的输入（特...
复制链接

扫一扫

专栏目录

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄5年

2070: 原创

-: 周排名

-: 总排名

341万+: 访问

: 等级

4万+: 积分

4917: 粉丝

4456: 获赞

1312: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

热点文章 552篇
AI 1079篇
热点文章 559篇
干货文章 39篇
热门文章 1篇
学术报告 11篇
干货文章 69篇
学术报告

最新评论

提前返回有好处吗？
温庭筠: 我不使用提前返回, 因为接手别人的代码时确实比较难理解一旦代码达到了维护阶段，新手程序员试图推理逻辑时，多次返回就会大大影响他们的效率（当注释比较分散，代码模糊不清时尤其糟糕）
在Windows系统和Linux系统中，如何打造一个好终端？
全栈小5: 文章结构严谨，每次阅读都能收获知识，感谢博主的分享，期待博主继续更新高质量文章，支持！【如何让windows终端和linux一样好用，博主这篇文章，值得一看】
NLP入门第一步：6种独特的数据标记方式
麦甜守望者: 有中文怎么标注的吗？
海量案例！生成对抗网络（GAN）的18个绝妙应用
PreWisdom: 18 Impressive Applications of Generative Adversarial Networks (GANs) by Jason Brownlee on July 12, 2019 in Generative Adversarial Networks https://machinelearningmastery.com/impressive-applications-of-generative-adversarial-networks/ 你知道我要说什么吧，你这完全是把别人的文章简单翻译了一下搬过来了，然后你发原创，真行啊
从零开始的人工智能和机器学习，该从哪里入手呢？
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8023395, 请多输出高质量博客, 帮助更多的人

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。