首先声明已知的数据:
m座房子,每个房子都有n条特征量,每个房子有售它对应的售价y。
房子 | 地理环境 | 建筑面积 | 使用时间 | 损坏程度 | 出售价 |
---|---|---|---|---|---|
房子1 | 1 | 1 | 10 | 2 | 1000万 |
房子2 | 2 | 3 | 20 | 2 | 1000万 |
房子3 | 4 | 1 | 30 | 2 | 1000万 |
房子4 | 6 | 8 | 40 | 2 | 1000万 |
数据是瞎写的,主要为了具象一下我的表述。
x
1
x^1
x1 是房子1的数据,表示一个4维向量。更普遍的讲是一个n维向量。
X
1
=
[
1
1
20
2
]
X^1= \left[\begin{matrix} 1 \\ 1 \\ 20 \\ 2 \\ \end{matrix} \right]
X1=⎣⎢⎢⎡11202⎦⎥⎥⎤
X 2 1 = 1 X^1_2=1 X21=1,表示第一个向量的第二个元素。
X j i X^i_j Xji 表示第 i i i个训练样本中第 j j j个特征量的值
举例说:
X 2 = [ 2 3 20 2 ] X^2= \left[\begin{matrix} 2 \\ 3 \\ 20 \\ 2 \\ \end{matrix} \right] X2=⎣⎢⎢⎡23202⎦⎥⎥⎤
X 3 2 X^2_3 X32 表示第2个训练样本中第3个特征量的值 3 。
第一节课 讨论一元特征量时我们使用的假设形式是:
h
θ
(
x
)
=
θ
0
+
x
⋅
θ
1
h_\theta(x)=\theta_0+x\cdot\theta_1
hθ(x)=θ0+x⋅θ1
其中
x
x
x 是唯一的特征量。
现在有多个特征量时,我们应该做出假设形式就应该是这样的:
h
θ
(
x
)
=
θ
0
+
x
1
⋅
θ
1
+
x
2
⋅
θ
2
+
x
3
⋅
θ
3
+
x
4
⋅
θ
4
(1)
h_\theta(x)=\theta_0+x_1\cdot\theta_1+x_2\cdot\theta_2+x_3\cdot\theta_3+x_4\cdot\theta_4\tag{1}
hθ(x)=θ0+x1⋅θ1+x2⋅θ2+x3⋅θ3+x4⋅θ4(1)
如果有
n
n
n个特征量那么就应该加到
x
n
x_n
xn ,像这样:
h
θ
(
x
)
=
θ
0
+
x
1
⋅
θ
1
+
x
2
⋅
θ
2
+
x
3
⋅
θ
3
+
x
4
⋅
θ
4
+
⋯
+
x
n
⋅
θ
n
h_\theta(x)=\theta_0+x_1\cdot\theta_1+x_2\cdot\theta_2+x_3\cdot\theta_3+x_4\cdot\theta_4+\dots+x_n\cdot\theta_n
hθ(x)=θ0+x1⋅θ1+x2⋅θ2+x3⋅θ3+x4⋅θ4+⋯+xn⋅θn
这里的
x
1
,
x
2
,
x
3
,
x
4
x_1,x_2,x_3,x_4
x1,x2,x3,x4 就表示 房子的4个特征量。
我们将第一个房子特征量带入可以得到这样的结果:
h θ ( x ) = θ 0 + 1 ⋅ θ 1 + 1 ⋅ θ 2 + 10 ⋅ θ 3 + 2 ⋅ θ 4 (2) h_\theta(x)=\theta_0+1\cdot\theta_1+1\cdot\theta_2+10\cdot\theta_3+2\cdot\theta_4\tag{2} hθ(x)=θ0+1⋅θ1+1⋅θ2+10⋅θ3+2⋅θ4(2)
每个样本 i i i都有一个向量 X i X^i Xi,并且每个向量有 X 0 i = 1 X^i_0=1 X0i=1,也就说我们假设每个样本都有第0个特征量 x 0 x_0 x0,并且 x 0 = 1 x_0=1 x0=1。
接着我们对上面的假设提供一种简单的写法:
对每个样本向量有
n
+
1
n+1
n+1维向量:
X
=
[
x
0
x
1
x
2
x
3
x
4
]
X= \left[\begin{matrix} x_0\\ x_1 \\ x_2 \\ x_3 \\ x_4 \\ \end{matrix} \right]
X=⎣⎢⎢⎢⎢⎡x0x1x2x3x4⎦⎥⎥⎥⎥⎤
把所有的参数也写成一个
n
+
1
n+1
n+1维向量(本实例
n
=
4
n=4
n=4)
Θ
=
[
θ
0
θ
1
θ
2
θ
3
θ
4
]
\Theta= \left[\begin{matrix} \theta_0\\ \theta_1 \\ \theta_2 \\ \theta_3 \\ \theta_4 \\ \end{matrix} \right]
Θ=⎣⎢⎢⎢⎢⎡θ0θ1θ2θ3θ4⎦⎥⎥⎥⎥⎤
求
X
X
X和
Θ
\Theta
Θ 的内积得到下面的结果:
h
θ
(
x
)
=
x
0
⋅
θ
0
+
x
1
⋅
θ
1
+
x
2
⋅
θ
2
+
x
3
⋅
θ
3
+
x
4
⋅
θ
4
(3)
h_\theta(x)=x_0\cdot\theta_0+x_1\cdot\theta_1+x_2\cdot\theta_2+x_3\cdot\theta_3+x_4\cdot\theta_4\tag{3}
hθ(x)=x0⋅θ0+x1⋅θ1+x2⋅θ2+x3⋅θ3+x4⋅θ4(3)
x
0
=
1
x_0=1
x0=1
这个式子和上面的式子是一样的。
如果我们将参数向量进行转置会得到:
Θ
T
=
[
θ
0
θ
1
θ
2
θ
3
θ
4
]
\Theta^T= \left[\begin{matrix} \theta_0 & \theta_1 & \theta_2 & \theta_3 & \theta_4 \end{matrix} \right]
ΘT=[θ0θ1θ2θ3θ4]
这个叫做行向量。
利用矩阵相乘有:
X ⋅ Θ T = [ θ 0 θ 1 θ 2 θ 3 θ 4 ] [ x 0 x 1 x 2 x 3 x 4 ] (4) X\cdot\Theta^T=\left[\begin{matrix} \theta_0 & \theta_1 & \theta_2 & \theta_3 & \theta_4 \end{matrix} \right]\left[\begin{matrix} x_0\\ x_1 \\ x_2 \\ x_3 \\ x_4 \\ \end{matrix} \right] \tag{4} X⋅ΘT=[θ0θ1θ2θ3θ4]⎣⎢⎢⎢⎢⎡x0x1x2x3x4⎦⎥⎥⎥⎥⎤(4)
他的结果也是这样的:
h
θ
(
x
)
=
x
0
⋅
θ
0
+
x
1
⋅
θ
1
+
x
2
⋅
θ
2
+
x
3
⋅
θ
3
+
x
4
⋅
θ
4
(5)
h_\theta(x)=x_0\cdot\theta_0+x_1\cdot\theta_1+x_2\cdot\theta_2+x_3\cdot\theta_3+x_4\cdot\theta_4\tag{5}
hθ(x)=x0⋅θ0+x1⋅θ1+x2⋅θ2+x3⋅θ3+x4⋅θ4(5)
这里也有 x 0 = 1 x_0=1 x0=1