机器学习个人笔记（二）之监督学习

最新推荐文章于 2023-11-11 16:25:16 发布

快乐小隆

最新推荐文章于 2023-11-11 16:25:16 发布

阅读量258

点赞数

分类专栏：机器学习小白入门记录文章标签：机器学习算法监督学习

本文链接：https://blog.csdn.net/weixin_44303979/article/details/108813751

版权

机器学习小白入门记录专栏收录该内容

3 篇文章 0 订阅

订阅专栏

前言：
该系列文章主要用于记录自己学习机器学习的过程，目的是为了鞭策自己和激励自己
我是跟着网易云课堂的吴恩达机器学习来学的，所以笔记也基本上是视频学习记录

定义

~~声明：本定义仅为个人理解，并非是官方专业定义~~
对于每一个样本集的因变量，都有唯一确定的真、假或者其他值与之相对应。
监督学习算法的目的就是找出一个函数，函数的自变量是样本，因变量是样本的真、假或者一个数值。这个要尽量拟合样本集的结果。
最后用这个函数来预测样本集里没有的数据

举例

以下举了两个例子来解释说明什么是监督学习，监督学习分为很多种，其中例子一是回归问题的监督学习，例子二是分类问题的监督学习

举例一、房子预测图

这个例子是针对回归问题的监督学习，“回归”是指样本的因变量（或者叫结果）是连续的，即便有时客观上不是连续的，但仍看为连续的。比如这个例子里的房子价格在中国可能是XX百万XX千XX百XX十XX元XX角XX分XX厘，虽然1厘和2厘直接还有很多数值，他们两个是离散的，但在回归问题当中，把他们两个看作是连续的
123456

图片出自吴恩达机器学习网易云课程，侵删
解释一下图片，这个是“房子价格预测图”，横坐标是房屋面积，纵坐标为价格。
红色X：是现在已经有的市场上卖出去的房屋样本数据——对应定义里的“样本集”
横坐标：房屋面积——对应定义里的“样本集的因变量”
纵坐标：价格——对应定义里的“唯一确定的真、假或者其他值”
粉色曲线：一个简单的预测房屋价格的函数——一次函数
蓝色曲线：一个比粉色曲线更精确一点点的预测函数——二次函数
横坐标上的绿色“750”：代表如果你朋友的正要卖的房子是750大小，与之相对应的预测你朋友的房子价格可能是，粉线的150K也可能是蓝线的200K。

详细解释

无。~~为了保持文章格式一致，所以没去除这部分~~

举例二、癌症预测图

这个例子是针对分类问题的监督学习，“分类”是指样本的因变量（或者叫结果）是离散的
在这里插入图片描述
图片出自吴恩达机器学习网易云课程，侵删
解释一下图片，这个是“肿瘤癌症预测图”。
红色X：确诊为癌症
蓝色O：诊断为非癌症
横坐标：肿瘤大小
纵坐标：患者年龄
黑色的斜线：人工简单粗暴的画了一条区分癌症的分界线
粉色的实心圆：一位待诊断得癌与否的样本信息