点到平面的距离问题
这里的公式出现在书的第122页. 在样本空间中, 划分超平面可通过如下线性方程来描述:
w T x + b = 0 w^Tx+b=0 wTx+b=0
其中 w = ( w 1 ; w 2 ; . . . ; w d ) w=(w_1;w_2;...;w_d) w=(w1;w2;...;wd)为法向量, 决定了超平面的方向; b b b为位移项, 决定了超平面与原点之间的距离. 显然, 划分超平面可以被法向量 w w w和位移 b b b确定. 试证明样本空间中任意点 x x x到超平面的距离可写为:
r = ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ r=\frac{|w^Tx+b|}{||w||} r=∣∣w∣∣∣wTx+b∣
证明:由于超平面的方程为 w T x + b = 0 w^Tx+b=0 wTx+b=0, 故 w w w为法向量. 设任意点的坐标为 x 1 x_1 x1, 在超平面上任找一点记为 x 2 x_2 x2, 与原点组成向量 a a a, 此时由于点 x 2 x_2 x2在超平面上, 故满足 w T x 2 + b = 0 w^Tx_2+b=0 wTx2+b=0, 将向量 w w w和向量 a a a做点积可得:
w T a = w T ( x 1 − x 2 ) = ∣ ∣ w ∣ ∣ ∣ ∣ x 1 − x 2 ∣ ∣ c o s θ ( θ 为 两 个 向 量 的 夹 角 ) ⇒ w T x 1 − w T x 2 = ∣ ∣ w ∣ ∣ ∣ ∣ x 1 − x 2 ∣ ∣ c o s θ w^Ta=w^T(x_1-x_2)=||w||||x_1-x_2||cos\theta(\theta为两个向量的夹角)\\ \Rightarrow w^Tx_1-w^Tx_2=||w||||x_1-x_2||cos\theta wTa=wT(x1−x2)=∣∣w∣∣∣∣x1−x2∣∣cosθ(θ为两个向量的夹角)⇒wTx1−wTx2=∣∣w∣∣∣∣x1−x2∣∣cosθ
由于 w T x 2 + b = 0 w^Tx_2+b=0 wTx2+b=0,故上式可转化为:
⇒ w T x 1 + b = ∣ ∣ w ∣ ∣ ∣ ∣ x 1 − x 2 ∣ ∣ c o s θ \Rightarrow w^Tx_1+b=||w||||x_1-x_2||cos\theta ⇒wTx1+b=∣∣w∣∣∣∣x1−x2∣∣cosθ
显然, 通过几何关系可知, x 1 x_1 x1到超平面的距离 r = ∣ ∣ a ∣ ∣ ∣ c o s θ ∣ r=||a|||cos\theta|