为什么机器学习很多时候不对模型的系数进行t检验以及F检验呢?
答:因为统计检验正确性的保证是需要有数据分布假设作为前提,而机器学习模型很多时候不在于数据分布而在乎优化问题,故此机器学习不需要也不能进行统计学中的t检验或者F检验。
为什么样本量大的时候适合采用机器学习的方法?
答:传统统计学在处理小样本数据的时候需要数据的分布假设,但是这个假设往往并不是数据的真实分布,但在小样本的时候我们只能无可奈何地依靠假设。而样本量大的时候,样本的分布几乎是总体分布,那么直接对样本进行fitting也就相当于对总体进行fitting,我们就不需要对总体分布进行假设了,可以直接看做是个优化问题,而优化问题又是机器学习的基础。