谈谈数学模型中的自由度
这里,我们简单谈谈建立一个数学模型时,一个最关键的问题。即什么样的模型是好的,或者说怎么评价模型的准确性。
我们仅仅给出一个基本的概念,具体操作方法将在后面进一步详述。但是千万不要认为基本概念的理解不重要,没有基础概念的理解,对所有方法的使用都将是邯郸学步,不能够灵活准确的使用。
在构建数学模型中经常遇到的一个问题
在构建数学模型解决实际问题的过程中,经常遇到的一个概念是过度拟合,即模型尽可能的贴近了训练数据,在测试数据中表现较差。很多算法都有这样的问题,例如在回归分析中,线性回归还是非线性回归?在应用KNN算法(K邻近)时选择K=1还是K=100?
在统计方法选择那篇文章中,我们提到了灵活性、光滑度或柔性水平这几个概念,其实它们都指向了自由度这个与数学模型相关的关键概念。
那么什么是“自由度”?
自由度这个概念经常会被我们提到。我们先不具体谈在每个模型或函数中自由度是如何体现的,而是先对自由度有一个直观的概念。我们可以简单的认为,自由度就是描述曲线光滑程度的量。限定性强且曲线平坦的模型比锯齿状的曲线具有更小的自由度。
一个最关键的问题——如何评价一个数学模型的精度
一个最普遍使用的评价模型精度的指标是均方误差(mean squared error, MSE),这个概念应用是如此的广泛,只要谈起数学模型总是绕不开它。其表达式为:
MSE=1n∑1n<