遇到数据特征比样本点还多的情况,不再能使用线性回归的方法,因为计算逆矩阵的时候会出错。
引入岭回归来解决特征数大于样本点个数的情况
一、岭回归
岭回归就是在矩阵 XTX 中加入 λI 来使矩阵非奇异,今儿能够计算其逆矩阵。矩阵I是一个m维的单位矩阵,对角线元素全为1, λ 是用户定义的一个数值,因此回归系数计算公式为:
【机器学习实战-python3】缩减系数来“理解”数据
最新推荐文章于 2024-07-20 19:22:56 发布
本文探讨了在特征数大于样本点时,如何利用岭回归解决线性回归的问题。岭回归通过引入λ来避免逆矩阵计算中的奇异问题。接着介绍了前向逐步回归,这是一种贪心算法,用于寻找重要特征并减少不必要数据收集。文章还讨论了模型的偏差与方差之间的权衡,并在乐高玩具价格预测案例中应用这些概念。
摘要由CSDN通过智能技术生成