1.1 数据集
使用 X n × d X_{n \times d} Xn×d 表示数据集, n n n 表示数据集的样例数, d d d 表示每个样例所对应的特征维度,其中第 i i i 个样本用 x i = ( x 1 , x 2 , … , x d ) x_i = (x_1, x_2, \dots, x_d) xi=(x1,x2,…,xd) 表示。
1.2 模型与损失函数
1.2.1 代数表示
模型
使用代数方法的线性回归模型表示为:
Y ^ = w 1 ∗ x 1 + w 2 ∗ x 2 + ⋯ + w d ∗ x d + b = ∑ i = 1 i = d w i ∗ x i + b (1) \hat{Y} = w_1 * x_1 + w_2 * x_2 + \dots + w_d * x_d + b = \sum_{i = 1}^{i = d} w_i * x_i + b \tag{1} Y^=w1∗x1+w2∗x2+⋯+wd∗xd+b=i=1∑i=dwi∗xi+b(1)
其中, b b b 为偏置项。
1.2.2 向量表示
模型
使用向量法表示线性回归模型:
Y ^ = X w + b (2) \hat{Y} = \bold{X} \bold{w} +b \tag{2} Y^=Xw+b(2)
其中, X \bold{X} X 是 n × d n \times d n×d 维的, w \bold{w} w 是 d × 1 d \times 1 d×1 维的, b b b 为标量。