目标:拟合非线性边界
想法:拟合复杂多项式
{
y
=
θ
0
+
θ
1
f
1
+
θ
2
f
2
+
θ
3
f
3
+
θ
4
f
4
f
1
=
x
1
,
f
2
=
x
2
,
f
3
=
x
1
x
2
,
d
4
=
x
4
2
\begin{cases} y\,\,=\theta _0+\theta _1f_1+\theta _2f_2+\theta _3f_3+\theta _4f_4\\ f_1=x_1, f_2=x_2,f_3=x_1x_2,d_4=x_{4}^{2}\\ \end{cases}
{y=θ0+θ1f1+θ2f2+θ3f3+θ4f4f1=x1,f2=x2,f3=x1x2,d4=x42
事实上,f1、f2、f3被表示得太复杂了,我们可以在不改变他们功能的前提下换个方式来表示他们(换个数学工具)
手动选取三个特征点,(x0为截距1,直接忽略),分别为
l
(
1
)
、
l
(
2
)
、
l
(
3
)
l^{\left( 1 \right)}\text{、}l^{\left( 2 \right)}\text{、}l^{\left( 3 \right)}
l(1)、l(2)、l(3)
每个l可以这么表示,举个例子:
f
1
=
s
i
m
i
l
a
r
i
t
y
(
x
,
l
(
1
)
)
=
exp
(
−
∥
x
−
l
(
1
)
∥
2
σ
2
)
f_1=similarity\left( x,l^{\left( 1 \right)} \right) =\exp \left( -\frac{\left\| x-l^{\left( 1 \right)} \right\|}{2\sigma ^2} \right)
f1=similarity(x,l(1))=exp(−2σ2∥∥x−l(1)∥∥)
注:
∥
x
∥
欧氏距离
\left\| x \right\| \,\,\text{欧氏距离}
∥x∥欧氏距离
similarity函数就是高斯kernel函数
注:这个函数与正态分布没什么实际上的关系,只是看上去像而已。
对kernel函数的介绍
对于
f
1
=
s
i
m
i
l
a
r
i
t
y
(
x
,
l
(
1
)
)
=
exp
(
−
∥
x
−
l
(
1
)
∥
2
σ
2
)
f_1=similarity\left( x,l^{\left( 1 \right)} \right) =\exp \left( -\frac{\left\| x-l^{\left( 1 \right)} \right\|}{2\sigma ^2} \right)
f1=similarity(x,l(1))=exp(−2σ2∥∥x−l(1)∥∥)
假设x接近
l
(
1
)
l^{\left( 1 \right)}
l(1),那么这个函数会接近于1
反着来想,函数会接近于0
假设
如果l1为[3 5],那么当x也为[3 5]时,f1才为1,否则离1的值会原来越远。
σ
2
会影响
f
值的变化(移动)
\sigma ^2\text{会影响}f\text{值的变化(移动)}
σ2会影响f值的变化(移动)
划定边界
{
设
y
=
θ
0
+
θ
1
f
1
+
θ
2
f
2
+
θ
3
f
3
θ
0
=
−
0.5
,
θ
1
=
1
,
θ
2
=
1
,
θ
3
=
0
\begin{cases} \text{设}y=\theta _0+\theta _1f_1+\theta _2f_2+\theta _3f_3\\ \theta _0=-0.5,\theta _1=1,\theta _2=1,\theta _3=0\\ \end{cases}
{设y=θ0+θ1f1+θ2f2+θ3f3θ0=−0.5,θ1=1,θ2=1,θ3=0
我们随机在图像上取一点(图中洋红色点)
通过设置
θ
\theta
θ就可以确定分类的边界(图中红圈)
选取特征点 l ( i ) l^{\left( i \right)} l(i)
直径从训练集里面选定样本点
我们通常是根据训练集的数量选择地标的数量,即如果训练集中有𝑚个实例,则我们选取 𝑚个地标,并且令𝑙(1)=𝑥(1),𝑙(2)=𝑥(2),…,𝑙(𝑚)=𝑥(𝑚)。这样做的好处在于:现在我们得到的新特征是建立在原有特征与训练集中所有其他特征之间距离的基础之上的,即(给定x):
算好了f之后,带入测试集,当 𝜃𝑇𝑓>=0 时,预测 𝑦=1
Σ𝜃𝑗2=𝜃𝑇𝜃
我们还需要对最后的正则化项进行些微调整,在计算∑𝜃2 = 𝜃𝑇𝜃时,我们用𝜃𝑇𝑀𝜃代替,其中𝑀是根据我们选择的核函数而不同的一个矩阵。这样做的原因是为了简化计算。
下面是支持向量机的两个参数
𝐶和 𝜎的影响: