CaptainBed人工智能学习笔记——3.如何判断预测的是否准确

       CaptainBed的官方学习网站:人工智能教程 (captainai.net)

        在前面的文章里,我分享了如何对数据进行训练和预测,那当我们成功的训练了模型,并对测试数据进行了预测后,又如何保证我们的预测结果是有一定的准确性的呢?

回顾

        我们首先来回顾一下前面两章学到的知识点,主要就是这两个公式:

                                                   (1)    \hat{y}^{(i)}=\sigma (w.Tx^{(i)}+b)

                                                   (2)    \sigma (z^{(i)})=1/(1+e^{-z(i)})

        其中\hat{y}就表示预测的结果,而对应的函数\sigma (z^{(i)})就是激活函数嵌套一个逻辑回归公式,将逻辑回归公式计算的结果转换为概率,也就是最后\hat{y}的值了。

        接下来,我就要介绍如何计算模型的预测是否准确了

损失函数

        我们先直接给出公式:

                                                        L(\hat{y}^{(i)},y^{(i)})=\frac{1}{2}(\hat{y}^{(i)}-y^{(i)})^2

        其中的\hat{y}指代对测试数据预测后的结果,而y^{(i)}是测试数据标准的正确结果,也就是后面会讲的标签,老师说理论上是可以用这个公式的,但是通常我们不会用,至于为什么我也还不知道哈哈哈哈哈,等到后面再和大家分享吧!

        因此,一般情况下,我们会用下面的公式:

                                  L(\hat{y}^{(i)},y^{(i)})=-(y^{(i)}log(\hat{y}^{(i)})+(1-y^{(i)})log(1-\hat{y}^{(i)}))

        损失函数(loss function)的结果越大,则预测的偏差越大,也就是预测结果越不准确,反之结果越小,则预测的偏差也越小,预测的结果也更准确。

成本函数 

        对于我之前讲的所有的知识,都是基于单一样本而言的,什么是样本?比如一张猫的图片,他就是一个样本,而这张图片所包含的像素数据,就是一个个的特征,千万要搞清楚样本和特征的区别,因为我就经常搞混...... 

        那么当我们有多个样本呢?一般来说,不论是训练数据还是测试数据,都不会只有一个单一的样本的,就像你小时候只见过猫一次,你就记住他是一只猫了嘛?又或者你永远只看一只猫,那别的品种或颜色的猫你都知道他是猫了嘛?显然是不可能的,你需要经常去见,去见很多很多不同的猫,这样你下次再见到,才会知道这是一只猫....

        因此当我们有多个样本,计算预测的是否准确,就需要一个成本函数来计算了,公式如下:

                            J(w,b)=-\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}log(\hat{y}^{(i)})+(1-y^{(i)})log(1-\hat{y}^{(i)})]

        这个函数的作用其实就是对每一个样本的损失函数进行累加,最后计算平均值罢了,就是那么简单,不要看公式那么长一串,其实就是这个意思。这种争对整个训练集的损失函数,我们就叫它成本函数(cost function),并且计算结果越大,成本越大,预测越不准确。

CaptainBed的官方学习网站:人工智能教程 (captainai.net)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LifeGPT

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值