监督学习和无监督学习


1. 监督学习

  • 定义:监督学习(supervised learning)指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。

        监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种"合理"的方式从一种从训练数据到看不见的情况下形成。
监督学习主要分为回归(regression)和分类(classification)两种

1. 回归

  • 定义:回归问题,就是拟合(x,y)的一条曲线,使得价值(或损失)函数(cost function) L最小。
    在这里插入图片描述
    下面举了一个来自B站的吴恩达机器学习经典名课的例子帮助理解。

        下面是一幅房价预测图,X坐标表示面积,Y坐标表示价格,图中的红叉是已知的数据。
在这里插入图片描述
        现在我们需要通过图中的已知数据,来推测未知Y轴所对应的值,如图中绿字,当X(面积)为750时,对应的Y轴(房价)应该是多少呢?
        这是我们需要通过这些已知数据(红叉点坐标)来拟合一条线,拟合面积与房价之间的关系,并且要尽可能多的把已知数据包括进去,下图中共拟合了两条线,显然曲线(蓝色)比直线(紫色)的预测效果要好。
在这里插入图片描述

2. 分类

  • 定义:找一个函数判断输入数据所属的类别,可以是二类别问题(是/不是),也可以是多类别问题(在多个类别中判断输入数据具体属于哪一个类别)。
    依然举了一个来自B站的吴恩达机器学习经典名课的例子帮助理解。

        下面是一个关于乳腺癌的肿瘤大小(Tunor Size)和是否为恶性(malignant)的二维图,其中Y轴0(N)处表示非恶性,1(Y)处表示恶性,蓝色叉为良性数据,红色叉为恶性数据。
在这里插入图片描述
        通过输入(肿瘤大小)输出0或1(离散值)来判断是否为恶性肿瘤,这是一个分类问题,有时输出不一定只有两种情况(二分类),也可能有多种情况比如0:良性肿瘤 1:乳腺癌 2:肺癌等(多分类)
在这里插入图片描述
        也可能影响类别的不只一个因素,如下图,年龄、肿瘤大小都对是否为恶性肿瘤造成影响。此时需要拟合一条线尽可能地分开两地类,如下图黑色线与坐标轴所围成的区域预测为良性,黑色线右方预测为恶性肿瘤。
在这里插入图片描述

2. 无监督学习

        在监督学习中,需要知道已知数据的标签,如下图1所示,而非监督学习中没有任何标签,图2所示,不知道拿这些数据做什么,但无监督学习可以吧这些数据分成两个不同的簇,即聚类算法。

图1 监督学习
图2 非监督学习

        举个例子,我们在百度搜索时,一般会使用关键词,如输入了“CSDN”,得到了如下关于CSDN的词条,百度用一个聚类算法来聚类这些词条到一起,所以是无监督学习。
在这里插入图片描述
        基因学的理解应用。一个DNA微观数据的例子。基本思想是输入一组不同个体,对其中的每个个体,你要分析出它们是否有一个特定的基因。技术上,你要分析多少特定基因已经表达。所以这些颜色,红,绿,灰等等颜色,这些颜色展示了相应的程度,即不同的个体是否有着一个特定的基因。你能做的就是运行一个聚类算法,把个体聚类到不同的类或不同类型的组(人)……
在这里插入图片描述
        所以这个就是无监督学习,因为我们没有提前告知算法一些信息,比如,这是第一类的人,那些是第二类的人,还有第三类,等等。我们只是说,是的,这是有一堆数据。我不知道数据里面有什么。我不知道谁是什么类型。我甚至不知道人们有哪些不同的类型,这些类型又是什么。但你能自动地找到数据中的结构吗?就是说你要自动地聚类那些个体到各个类,我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据,所以这就是无监督学习。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

狂奔的菜鸡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值