Where does the error come from

本文探讨了在编程中遇到的错误如何定位及解决,从错误类型、堆栈跟踪到调试技巧,帮助开发者有效找到问题根源。
摘要由CSDN通过智能技术生成

//李宏毅视频官网:http://speech.ee.ntu.edu.tw/~tlkagk/courses.html                                                    点击此处返回总目录

//邱锡鹏《神经网络与深度学习》官网:https://nndl.github.io

 

 

我们上一次讲到,使用不同的model,在testing data上会得到不同的error。而且越复杂的model不一定会得到越低的error。

                                              

今天我们要讨论的问题是,error来自什么地方。

其实error有两个来源,一个是"bias",一个是“variance”。了解error的来源是重要的,因为你常常做一下machine learning,做完就得到一个error,接下来你要怎么improve你的model呢。如果没有什么方向,毫无头绪的乱做,你就没有效率。如果你可以诊断你的error的来源,你就可以挑选适当的方法来improve你的model。

 

-------------------------------------------------------------------------------------------------------------------------------

上一节的时候,我们要预测宝可梦进化后的CP值,也就说要找一个function,这个function input一只宝可梦,output就是进化后的CP值。这个function理论上有一个最佳的function,我们写成f^。但是这个理论上最佳的function我们是不知道的,只有Niantic是知道的,Niantic就是做宝可梦的公司。f^是我们不知道的,我们能做的事情就是,实际去抓一些宝可梦,根据training data,去学到的最好的function,f*。f*并不会真的等于f^,因为并不知道f^是什么样子,f*可能不等于f^。f*就好像是f^的估测值一样。

 

                              

 

就想成,是在打靶。f^是靶的中心,收集到一些data,做training以后,你找到一个你觉得最好的function f*,这个f*不等于f^,它是在靶纸上的另外一个位置。这个f*与f^中间有一段距离,这个距离呢,来自于两件事:它可能来自于bias,也可能来自于variance。

 

-------------------------------------------------------------------------------------------------------------------------------

在讲下一页之前,本人回顾一下概率论的内容,主要是矩估计的知识点。

                 

                 

下面给出证明:

 

               

               

-------------------------------------------------------------------------------------------------------------------------------

bias和variance是什么呢?我们先举一个概率里面的例子,概率与统计学过。

假设有一个变量x,想要估计它的mean,怎么做呢?假设x的mean是,variance是

                             

第一,要估测怎么做呢?首先sample N个点,再把这N个点算平均值,得到m。

                             

N个点算平均值m会跟一样么?其实不会。

假设红点为的value,现在做一次sample,算出来的m可能不会跟一样。再做一次实验m2,不一样。m3,m4,m5,m6可能都不一样,可能没有办法算出来的m exactly等于

                                                          

但是,如果今天把m的期望值算出来的话:

                               

得到的值就是。每一个m虽然都不一定跟exactly一样,但是如果找很多m,他们的期望值呢会正好等于。所以用m来estimate 

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值