如果仅仅凭基础统计上的一个定义的话,这个概念不好理解;但是这个概念也没那么难,甚至不用追根溯源,各种复杂的模型见得多了慢慢就会有直觉的感悟。
我试着用最直白的话解释一下。
本质上,自由度是做一个估计(推测)时,所拥有的独立信息(证据)的数量。
举一个生活中的例子:
case 1. 你发现今天早上上班同事表情非常严肃,你推测他可能和别人吵架了。“和别人吵架了”是你的一个估计(推测),你为了验证这个想法,走近发现他脖子上有伤痕,你会想哎呀这吵的还挺厉害,都动手了;再和他说几句话,你又发现他语气非常冲,一直对另外一个同事骂骂咧咧的,到这个时候,你心里面应该已经比较肯定之前的推测了。这个例子里,“脖子有伤”和“语气很冲”是两个独立证据,所以这时候自由度是2。
case 2. 你发现今天早上上班同事表情非常严肃,你推测他可能和别人吵架了。“和别人吵架了”是你的一个估计(推测),你为了验证这个想法,走近发现他脖子上有伤痕;再上下打量一下,发现他手指也破了。到这个时候,和case 1比起来,你觉得哪个情况证据更充分呢?这个例子里,“脖子有伤”和“手指破了”不是完全独立的证据,所以这时候自由度是1。你知道再多其他有伤的地方也提供不了给你更多的新信息了。
case 3. 你发现今天早上上班同事表情非常严肃,你推测他可能和别人吵架了。“和别人吵架了”是你的一个估计(推测);然后你跟我说了,我问你,你有什么证据吗?你说,证据就是他表情非常严肃。这里你就犯了一个循环论证的错误,你实际上没有任何证据支持你的假设,而只是对一个事实事后的解释。这时候,自由度是0。
归纳一下上面三种情况,我们可以得到一个经验的公式,来迅速判断支持一个估计(推测)的独立信息(证据)数量:独立信息的个数 (N)- 独立估计的个数(k)
那么再回到case 1. 这里面有三个独立信息,即“表情严肃”,“脸上有伤”,“语气很冲”,所以N = 3;你只做了一个估计,即“和别人吵架了”,所以k = 1;所以自由度就是 N - k = 2
所以,你想说你估计(推测)的多么可靠,那么当然是自由度越大越好了。
以上。