多元线性模型
这一节的内容可以看作是之前一元线性模型的提高,
其中要明白符号的意思
x
j
(
i
)
表
示
第
i
个
样
本
中
的
j
指
标
\ x_j^{(i)} 表示第 i 个样本中的j指标
xj(i)表示第i个样本中的j指标
找到满足假设的参数
梯度下降法
单纯的公式推导
特征放缩
如果对于数据 x 1 和 x 2 \ x_1和x_2 x1和x2,来说,如果数量级别相差很大的话,就需要对数据进行特征放缩,使得梯度下降计算更为简单。【比如下面 x 1 和 x 2 \ x_1和x_2 x1和x2的数量级就相差很大。】
B.It speeds up gradient descent by making it require fewer iterations to get to a good solution.
加快了梯度下降,通过更少的迭代来达到一个好的结果
可以对
x
1
和
x
2
\ x_1和x_2
x1和x2进行处理
学习率的判断和选择
学习率太大的情况:
学习率太小的情况:
正规方程
需要补上
x
0
\ x_0
x0
记住这条公式
两种方法的比较
如果数据量小于一万的话,选择正规方程.【复杂度较高,低于一万可以忽略】
如果数据量大于一万的话,选择梯度下降方程.[有学习率(需要判断,麻烦)、需要多次迭代]