标准方程法(区别对立与梯度下降法)
不是迭代下降寻找最优解,而是通过计算求解(利用微积分)
步骤:
①对每一变量对应系数求偏导数;
②令偏导数为零;求解此时系数。
可直接利用程序实现:图示关系通过程序直接实现
y=X*theta ——
梯度下降与标准方程法区别:图示
(特征变量归一化在梯度下降时有要,但标准方程法则没有必要)两种算法都有可取之处,根据实际情况选择。
标准方程法——(XT*X)不可逆时怎么办
1. 存在冗余特征变量——减少特征变量个数:(线性减少)
2. 当有很多特征变量时,特征变量数多余训练样本数——delete 一些特征变量,或者使用regularization(接下来章节)。
图示: