机器学习笔记(菜鸟版

最新推荐文章于 2023-11-01 19:00:57 发布

别卷了好吗

最新推荐文章于 2023-11-01 19:00:57 发布

阅读量296

点赞数 1

文章标签：人工智能 python

本文链接：https://blog.csdn.net/weixin_73897131/article/details/128270221

版权

机器学习笔记

（之前已经写过一些基本的概念了，这里就不过多的赘叙了）

这里写目录标题，emm

机器学习笔记

监督学习

这一类是用于分类问题上面的
监督学习就是每个数据集都会提供一份答案
而无监督学习则是没有答案，需要机器自己进行一个分类
也就是进行聚类
或者是通过哦相似度量来进行一个分类

而两者的最大区别在于
到底有没有答案或者是衡量的标准
所以也就导致了有无答案集成为选择两者的一个最大因素，除此之外还有就是两者是否会有标签

过拟合与欠拟合

通俗的理解如下：
当你做作业做了太多关于f（x）的题目
这也就导致了思维的固化
等到了考试的时候，面对g（x）的题目（但是本质还是f（x））就一脸懵b的状态
这就是过于拟合的状态，就是机器的方法过于贴近样本集反而可能会脱离本质？

欠拟合的意思就是作业做太少了，一上考场这没见过，那没见过

损失函数

所有的损失函数都是关于参数o/o1/o2…的函数
（这有点焦头烂额了）

1.较简单的，大多用于分类算法的损失函数，如果用于回归函数就过于苛刻了，这个条件

在这里插入图片描述
这里的函数指的是每个参数对应全部的样本集进行比较，然后再相加
例如： 1,3,3,4,15
如果使用 y=x
则 f(o=1)=(1=1)+(3!=2)+…
=0+1+0+0+1=2
说明只有两个数据不拟合
如果使用y=3x
则 f(o=1)=(3!=1)+(6!=2)+…
=1+1+1+1+0=4
说明只有一个数据拟合
这个时候我们就可以画出函数图
在这里插入图片描述
由此我们可以看到
当o=1的时候，损失函数值最小
也就是说损失的最小，拟合的最佳

1.最小二乘法，这个是回归函数使用的最多的

在这里插入图片描述
注释： m个样本集求和得出来的测试值

所以对应的参数o1，o2不一样，所对应的 j(t)也不一样

例子：
我们先假设一个简单的函数把y= ?x，只有一个参数？
所以，损失函数的图像对应的x轴为？而y轴对于的是损失函数的值
在这里插入图片描述
那么当？ =1 的时候，会发现全部数据都拟合了，所以得到以下的损失函数图像

而当？ = 0.5，的时候会发现都不大拟合，所以损失函数会变大

计算过程如下：

加上？ =1的时候的数据得到了

所以当有很多的数据的时候
就可以连城一条光滑的曲线
在这里插入图片描述
而最低点就是损失最小的时候，这个就是后面的梯度下降法所要学习的