过拟合,正则化,特征值,特征向量一些知识点

最新推荐文章于 2023-04-12 08:00:00 发布

素笺清风

最新推荐文章于 2023-04-12 08:00:00 发布

阅读量1.2k

点赞数 1

本文链接：https://blog.csdn.net/weixin_45834085/article/details/102939451

版权

本文深入探讨了过拟合的概念、判断方法、产生原因及解决方案。接着，介绍了正则化的两种形式——L1和L2正则化，对比了它们的特点。最后，详细阐述了特征值和特征向量的定义及其几何意义。

摘要由CSDN通过智能技术生成

过拟合是指为了得到一致假设而使假设变得过度严格。

一个假设在训练数据上能够获得比其他假设更好的拟合，但是在训练数据外的数据集上却不能很好地拟合数据，此时认为这个假设出现了过拟合的现象。

		1.训练集的数量级要小于模型的复杂度(训练数据太少)
		2.训练集和测试集特征分布不一致；
		3.训练数据中存在噪音,噪音数据干扰过大，大到模型过分记住了噪音特征，反而忽略了真实的输入输出间的关系；
		4.权值学习迭代次数足够多,拟合了训练数据中的噪声和训练样例中没有代表性的特征。

		1.丢弃一些不能帮助我们正确预测的特征。可以手工选择保留哪些特征,或者使用一些模型选择的算法来帮忙。
		2.训练集越多，过拟合的概率越小。在计算机视觉领域中，增广的方式是对图像旋转，缩放，剪切&

关注