机器学习个人笔记(二)之监督学习

前言:
该系列文章主要用于记录自己学习机器学习的过程,目的是为了鞭策自己和激励自己
我是跟着网易云课堂的吴恩达机器学习来学的,所以笔记也基本上是视频学习记录

定义

声明:本定义仅为个人理解,并非是官方专业定义
对于每一个样本集的因变量,都有唯一确定的真、假或者其他值与之相对应。
监督学习算法的目的就是找出一个函数,函数的自变量是样本,因变量是样本的真、假或者一个数值。这个要尽量拟合样本集的结果。
最后用这个函数来预测样本集里没有的数据

举例

以下举了两个例子来解释说明什么是监督学习,监督学习分为很多种,其中例子一是回归问题的监督学习,例子二是分类问题的监督学习

举例一、房子预测图

这个例子是针对回归问题的监督学习,“回归”是指样本的因变量(或者叫结果)是连续的,即便有时客观上不是连续的,但仍看为连续的。比如这个例子里的房子价格在中国可能是XX百万XX千XX百XX十XX元XX角XX分XX厘,虽然1厘和2厘直接还有很多数值,他们两个是离散的,但在回归问题当中,把他们两个看作是连续的
123456

图片出自吴恩达机器学习网易云课程,侵删
解释一下图片,这个是“房子价格预测图”,横坐标是房屋面积,纵坐标为价格。
红色X:是现在已经有的市场上卖出去的房屋样本数据——对应定义里的“样本集”
横坐标:房屋面积——对应定义里的“样本集的因变量”
纵坐标:价格——对应定义里的“唯一确定的真、假或者其他值”
粉色曲线:一个简单的预测房屋价格的函数——一次函数
蓝色曲线:一个比粉色曲线更精确一点点的预测函数——二次函数
横坐标上的绿色“750”:代表如果你朋友的正要卖的房子是750大小,与之相对应的预测你朋友的房子价格可能是,粉线的150K也可能是蓝线的200K。

详细解释

无。为了保持文章格式一致,所以没去除这部分

举例二、癌症预测图

这个例子是针对分类问题的监督学习,“分类”是指样本的因变量(或者叫结果)是离散的
在这里插入图片描述
图片出自吴恩达机器学习网易云课程,侵删
解释一下图片,这个是“肿瘤癌症预测图”。
红色X:确诊为癌症
蓝色O:诊断为非癌症
横坐标:肿瘤大小
纵坐标:患者年龄
黑色的斜线:人工简单粗暴的画了一条区分癌症的分界线
粉色的实心圆:一位待诊断得癌与否的样本信息

详细解释

一位待诊断病患可能其各项数据如图粉色实心圆所示,现在要做的是判断一下该患者是否是癌症患者。
监督学习在这里做的事情是,帮助医生画这条“区分癌症的分界线",然后根据分界线来判断患者是否是癌症。

后记

上述的例子当中可能其特征(指肿瘤大小和年龄)只有两个,但现实当中特征可能会有很多,比如细胞的形状之类的,所以需要一个可以处理很多很多特征的算法,这种算法在之后的文章中会讲到。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值