# 2021.09.04
# 抱歉拖更了,最近事太多了,如果点赞超过一个,明天更新下一P
# 内容P3-P4
# 可参考以前一篇内容:https://blog.csdn.net/wistonty11/article/details/115719169
文章目录
P3:线性回归
3.0 机器学习分类
-
机器学习分类
监督学习、无监督学习、强化学习、半监督等
-
监督学习分类
回归问题、分类问题
-
模型
线性回归 逻辑回归
3.1 什么是回归
找到一个函数 f ( x ) f(x) f(x) ,通过输入特征数据x,输出一个数值 Scalar
-
【助解】类似于回归自然,回归自我。回归就是用估计值来靠近真实值
-
【和分类的区别】
分类和回归的区别不在于输入,而是输出的连续还是离散
预测房价的价格是一个回归任务;
我们数据多了,100平方的房子100万和100.5平方的房子100.5万,输出的房价是非常靠近的,分得越小输出约连续。
预测一张图片是猫还是狗的图片是分类任务。
-
回归问题也可以变成分类问题
比如我只有100.3万 超过了不买,没超过买。那么就成了分类问题。也变成了离散的
3.2 线性回归
线性回归就是要找一条线,尽可能地拟合(靠近)图中的数据点。
- 比如以下输入点大致满足线性
3.3 模型步骤
- step1:模型假设,选择模型框架(线性模型)
- step2:模型评估,如何判断众多模型的好坏(损失函数)
- step3:模型优化,如何筛选最优的模型(梯度下降)
3.3.1 选择模型框架:线性模型
线性模型 Linear model: y = b + ∑ w i x i y = b + \sum w_ix_i y=b+∑wixi
-
① 这个y是个估计值,我们确定模型后,通过数据 x i x_i xi,计算出来的,通常和真实值有误差;
-
② 这里 x i x_i xi为向量,是一个特征
比如:
x c p x_{cp} xcp为宝可梦CP(战斗点数),y理解为战斗力,它的战斗力不仅和战斗点数有关,可能还和物种(Bulbasaur)、血量(HP)、重量(Weight)、高度(Height)等特征有关 -
③ b是偏移量,是个具体数
3.3.2 模型评估:损失函数
- 我们拿到一批数据,已知: x i x_i xi, 真实值 y ^ \hat{y} y^ 未确定:w, b
- 目的是:真实值和估计值中间差最小
我们将真实值和估计值设置这个差值叫做损失函数Loss
以单个特征 x c p x_{cp} xcp为例, 我们手里有1-10级的数据
损失函数: L ( f ) = ∑ n = 1 10 ( y ^ − f ( x c p n ) ) 2 L(f) = \sum_{n=1}^{10}{({\hat{y}-f(x_{cp}^n)})^2} L(f)=∑n=110