scikit-learn 实战之监督学习 1

最新推荐文章于 2024-08-03 10:44:06 发布

oxuzhenyi

最新推荐文章于 2024-08-03 10:44:06 发布

阅读量1.1k

点赞数

分类专栏：实验楼课程机器学习

实验楼课程同时被 2 个专栏收录

168 篇文章 42 订阅

订阅专栏

38 篇文章 3 订阅

订阅专栏

scikit-learn 实战之监督学习

一、实验介绍

1.1 实验内容

监督学习（英语：Supervised learning）是机器学习中最为常见，且应用最为广泛的分支之一。这是实验课程的第一章节，将带你了解什么是监督学习？

1.2 实验知识点

监督学习概念
常见的监督学习方法

1.3 实验环境

python2.7
Xfce 终端
ipython

1.4 适合人群

本课程难度为一般，属于初级级别课程，适合具有 Python 基础和线性代数基础，并对机器学习中分类问题感兴趣的用户。

二、监督学习介绍

2.1 什么是监督学习？

机器学习中，我们通常会接触到：监督学习、非监督学习、半监督学习，强化学习等不同的应用类型。其中，监督学习（英语：Supervised learning）是最为常见，且应用最为广泛的分支之一。

监督学习的目标是从已知训练数据中学习一个预测模型，使得这个模型对于其他输入数据产生一个预测输出。其中，监督学习的“监督”是相对与“非监督”的一种表达，二者的区别在于，监督学习的训练数据经过了人工特征标注，而非监督学习则没有这个过程。

此处输入图片的描述

如同上面的两个简单的数据集。第一个数据集明显没有经过标注。而第二个数据集则进行了颜色标注。

2.2 监督学习的类型

监督学习中，所面对的问题大致分为两类：分类和回归。

其中，分类问题可以简单概括为：已有了一些数据样本及明确的样本分类。现在从这些样本的特征中总结规律，再用于判断新输入样本到底属于哪一类别。

分类的例子在生活中处处可见。比如这里正在讲，监督学习可以分为分类和回归一样。而面对一个新问题，判断它是属于分类还是回归，就需要根据这个问题具备的特征来判断。

其中，回归问题与分类问题的最大区别（特征）在于，输出变量的类型不同。详细说来：

分类问题，输出为有限个离散变量，布尔值或者定类变量。
回归问题，输出为连续变量，一般为实数，也就是一个确切值。

举个例子，当我们预测一个人的性别时，就是一个典型的分类问题。而预测一个人的年龄时，则应看作是回归问题。

好了，现在你应该对分类和回归比较清楚了。

2.3 常见的监督学习方法

机器学习中，常见的监督学习方法有很多，例如：广义线性模型、支持向量机、k近邻、决策树、朴素贝叶斯、逻辑回归等。其中的一些方法都有着比较复杂的数学过程，如果每一次都需要自己通过代码实现这些算法，那么机器学的门槛就变得很高了。

scikit-learn 是一个十分流行的开源机器学习工具，它将众多的机器学习算法封装起来，往往只需要几行代码，通过简单的方法类调用，就可以实现原本复杂的机器学习模型。接下来，我们就一起动手完成一些监督学习小实验。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。