CaptainBed的官方学习网站:人工智能教程 (captainai.net)
在前面的文章里,我分享了如何对数据进行训练和预测,那当我们成功的训练了模型,并对测试数据进行了预测后,又如何保证我们的预测结果是有一定的准确性的呢?
回顾
我们首先来回顾一下前面两章学到的知识点,主要就是这两个公式:
(1)
(2)
其中就表示预测的结果,而对应的函数就是激活函数嵌套一个逻辑回归公式,将逻辑回归公式计算的结果转换为概率,也就是最后的值了。
接下来,我就要介绍如何计算模型的预测是否准确了
损失函数
我们先直接给出公式:
其中的指代对测试数据预测后的结果,而是测试数据标准的正确结果,也就是后面会讲的标签,老师说理论上是可以用这个公式的,但是通常我们不会用,至于为什么我也还不知道哈哈哈哈哈,等到后面再和大家分享吧!
因此,一般情况下,我们会用下面的公式:
损失函数(loss function)的结果越大,则预测的偏差越大,也就是预测结果越不准确,反之结果越小,则预测的偏差也越小,预测的结果也更准确。
成本函数
对于我之前讲的所有的知识,都是基于单一样本而言的,什么是样本?比如一张猫的图片,他就是一个样本,而这张图片所包含的像素数据,就是一个个的特征,千万要搞清楚样本和特征的区别,因为我就经常搞混......
那么当我们有多个样本呢?一般来说,不论是训练数据还是测试数据,都不会只有一个单一的样本的,就像你小时候只见过猫一次,你就记住他是一只猫了嘛?又或者你永远只看一只猫,那别的品种或颜色的猫你都知道他是猫了嘛?显然是不可能的,你需要经常去见,去见很多很多不同的猫,这样你下次再见到,才会知道这是一只猫....
因此当我们有多个样本,计算预测的是否准确,就需要一个成本函数来计算了,公式如下:
这个函数的作用其实就是对每一个样本的损失函数进行累加,最后计算平均值罢了,就是那么简单,不要看公式那么长一串,其实就是这个意思。这种争对整个训练集的损失函数,我们就叫它成本函数(cost function),并且计算结果越大,成本越大,预测越不准确。
CaptainBed的官方学习网站:人工智能教程 (captainai.net)