机器学习中遇到的值得思考的问题(持续更新)
1.监督学习
1.1为什么机器学习必须满足独立同分布这一先决条件呢?
机器学习模型是根据已有数据train_data训练所得,我们希望模型能够学习到数据中的绝大部分的信息,从而能够很好地对未知的数据做出最准确的预测和判断.也就是训练数据与实际满足独立同分布可以使模型拥有更好的泛化性能。如果所用训练数据偏向于空间的某一处很可能导致模型泛化性能大大降低,这也是过拟合的一个原因。
机器学习并不总是要求数据同分布。在不少问题中要求样本(数据)采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集,使
原创
2020-06-16 00:12:43 ·
231 阅读 ·
0 评论