scikit-learn 实战之监督学习 1

scikit-learn 实战之监督学习

一、实验介绍

1.1 实验内容

监督学习(英语:Supervised learning)是机器学习中最为常见,且应用最为广泛的分支之一。这是实验课程的第一章节,将带你了解什么是监督学习?

1.2 实验知识点

  • 监督学习概念
  • 常见的监督学习方法

1.3 实验环境

  • python2.7
  • Xfce 终端
  • ipython

1.4 适合人群

本课程难度为一般,属于初级级别课程,适合具有 Python 基础和线性代数基础,并对机器学习中分类问题感兴趣的用户。

二、监督学习介绍

2.1 什么是监督学习?

机器学习中,我们通常会接触到:监督学习、非监督学习、半监督学习,强化学习等不同的应用类型。其中,监督学习(英语:Supervised learning)是最为常见,且应用最为广泛的分支之一。

监督学习的目标是从已知训练数据中学习一个预测模型,使得这个模型对于其他输入数据产生一个预测输出。其中,监督学习的“监督”是相对与“非监督”的一种表达,二者的区别在于,监督学习的训练数据经过了人工特征标注,而非监督学习则没有这个过程。

此处输入图片的描述

如同上面的两个简单的数据集。第一个数据集明显没有经过标注。而第二个数据集则进行了颜色标注。

2.2 监督学习的类型

监督学习中,所面对的问题大致分为两类:分类和回归。

其中,分类问题可以简单概括为:已有了一些数据样本及明确的样本分类。现在从这些样本的特征中总结规律,再用于判断新输入样本到底属于哪一类别。

分类的例子在生活中处处可见。比如这里正在讲,监督学习可以分为分类和回归一样。而面对一个新问题,判断它是属于分类还是回归,就需要根据这个问题具备的特征来判断。

其中,回归问题与分类问题的最大区别(特征)在于,输出变量的类型不同。详细说来:

  • 分类问题,输出为有限个离散变量,布尔值或者定类变量。
  • 回归问题,输出为连续变量,一般为实数,也就是一个确切值。

举个例子,当我们预测一个人的性别时,就是一个典型的分类问题。而预测一个人的年龄时,则应看作是回归问题。

好了,现在你应该对分类和回归比较清楚了。

2.3 常见的监督学习方法

机器学习中,常见的监督学习方法有很多,例如:广义线性模型、支持向量机、k近邻、决策树、朴素贝叶斯、逻辑回归等。其中的一些方法都有着比较复杂的数学过程,如果每一次都需要自己通过代码实现这些算法,那么机器学的门槛就变得很高了。

scikit-learn 是一个十分流行的开源机器学习工具,它将众多的机器学习算法封装起来,往往只需要几行代码,通过简单的方法类调用,就可以实现原本复杂的机器学习模型。接下来,我们就一起动手完成一些监督学习小实验。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值