支持向量机SMO算法求解过程分析

1.SVM对偶函数最后的优化问题

29151353_iJov.jpg

29151353_aTDL.jpg

            29151354_LHjC.jpg

            29151354_ui6N.jpg

2. 对核函数进行缓存

29151354_ris0.jpg

由于该矩阵是对称矩阵,因此在内存中的占用空间可以为m(m+1)/2

映射关系为:

29151355_opV9.jpg

#define OFFSET(x, y) 	((x) > (y) ? (((x)+1)*(x) >> 1) + (y) : (((y)+1)*(y) >> 1) + (x))
//...
	for (unsigned i = 0; i < count; ++i)
		for (unsigned j = 0; j <= i; ++j)
			cache[OFFSET(i, j)] = y[i] * y[j] * kernel(x[i], x[j], DIMISION);
//...

3. 求解梯度

既然α值是变量,因此对α值进行求导,后面根据梯度选取α值进行优化。

梯度:29151355_K7wZ.jpg

	for (unsigned i = 0; i < count; ++i)
	{
		gradient[i] = -1;
		for (unsigned j = 0; j < count; ++j)
			gradient[i] += cache[OFFSET(i, j)] * alpha[j];
	}

29151355_CG6R.jpg

29151355_Ldnk.jpg

若使W最大,则当α减少时,G越大越好。反之,G越小越好。

4. 序列最小化法(SMO)的约束条件

每次选取2个α值进行优化,其它α值视为常数,根据约束条件29151354_LHjC.jpg得:

29151356_vFjv.jpg

29151356_MtoP.jpg

29151356_WqQo.jpg

 

进行优化之后:

29151357_5RZD.jpg

5. 制定选取规则

由于α的范围在区间[0,C],所以△α受α约束

29151357_NcZs.jpg

29151357_vtv6.jpg

29151358_PGQ0.jpg

29151358_QWYu.jpg

29151359_fdbD.jpg

29151359_auur.jpg

29151359_ovlb.jpg

29151400_Jhik.jpg

29151400_Wk5D.jpg

 

若选取的29141438_YnJH.jpg29141438_KgFM.jpg异号,即λ=-1,则29141439_GZE9.jpg29141439_FuJn.jpg增减性相同

假设29141440_txTe.jpg29141440_nhUO.jpg

29141440_qYt2.jpg,则29141441_do4m.jpg,此时应选取29141441_WZj4.jpg

上述命题可化为(注:29141442_WR03.jpg29141442_vOwD.jpg等价)

29141443_8PIk.jpg

29141443_m5Gk.jpg

 

若选取的29141438_YnJH.jpg29141438_KgFM.jpg同号,即λ=1,则29141439_GZE9.jpg29141439_FuJn.jpg增减性相异

29141440_qYt2.jpg,则29141735_WlYY.jpg,此时应选取29141735_7IsC.jpg,29141735_h0Qs.jpg

上述命题可化为(注:29141442_WR03.jpg29141442_vOwD.jpg等价)

29141443_YgZa.jpg

29141444_P6qb.jpg

29141444_F7sf.jpg

29141443_m5Gk.jpg

 

将上述结论进行整理,可得(为了简便此处只选取G前的符号与y的符号相异的情况)

29141445_LMN7.jpg

29141445_B2qz.jpg

unsigned x0 = 0, x1 = 1;
//根据梯度选取进行优化的alpha值
{
	double gmax = -DBL_MAX, gmin = DBL_MAX;
	for (unsigned i = 0; i < count; ++i)
	{
		if ((alpha[i] < C && y[i] == POS || alpha[i] > 0 && y[i] == NEG) && -y[i] * gradient[i] > gmax)
		{
			gmax = -y[i] * gradient[i];
			x0 = i;
		}
		else if ((alpha[i] < C && y[i] == NEG || alpha[i] > 0 && y[i] == POS) && -y[i] * gradient[i] < gmin)
		{
			gmin = -y[i] * gradient[i];
			x1 = i;
		}
	}
}

6. 开始进行求解

alpha要求在区间[0,C]内,对不符合条件的alpha值进行调整,调整规则如下。 

29132302_pJ9r.jpg

29132303_wm30.jpg

29132303_q6ct.jpg

29132303_5phG.jpg

29132303_rv44.jpg

29132303_DQXd.jpg

29132304_VWbq.jpg

29132304_4eSz.jpg

分2种情况,若λ=-1,即:

29132304_J1ZW.jpg

代入后得:

29120553_GRYI.jpg

29120553_RYcp.jpg

29120740_GIpQ.jpg

29120553_aGSf.jpg

29120554_YBn5.jpg

if (y[x0] != y[x1])
{
	double coef = cache[OFFSET(x0, x0)] + cache[OFFSET(x1, x1)] + 2 * cache[OFFSET(x0, x1)];
	if (coef <= 0) coef = DBL_MIN;
	double delta = (- gradient[x0] - gradient[x1]) / coef;
	double diff = alpha[x0] - alpha[x1];
	alpha[x0] += delta;
	alpha[x1] += delta;
	unsigned max = x0, min = x1;
	if (diff < 0)
	{
		max = x1;
		min = x0;
		diff = -diff;
	}
	if (alpha[max] > C)
	{
		alpha[max] = C;
		alpha[min] = C - diff;
	}
	if (alpha[min] < 0)
	{
		alpha[min] = 0;
		alpha[max] = diff;
	}
}

若λ=1,即:

29132304_jupd.jpg

29120554_M776.jpg

29120554_NePk.jpg

29120740_GIpQ.jpg

29120554_GaJY.jpg

29120555_mvV6.jpg

{
	double coef = cache[OFFSET(x0, x0)] + cache[OFFSET(x1, x1)] - 2 * cache[OFFSET(x0, x1)];
	if (coef <= 0) coef = DBL_MIN;
	double delta = (-gradient[x0] + gradient[x1]) / coef;
	double sum = alpha[x0] + alpha[x1];
	alpha[x0] += delta;
	alpha[x1] -= delta;
	unsigned max = x0, min = x1;
	if (alpha[x0] < alpha[x1])
	{
		max = x1;
		min = x0;
	}
	if (alpha[max] > C)
	{
		alpha[max] = C;
		alpha[min] = sum - C;
	}
	if (alpha[min] < 0)
	{
		alpha[min] = 0;
		alpha[max] = sum;
	}
}

然后进行梯度调整,调整公式如下:

29120555_UDQc.jpg

for (unsigned i = 0; i < count; ++i)
	gradient[i] += cache[OFFSET(i, x0)] * delta0 + cache[OFFSET(i, x1)] * delta1;

7.进行权重的计算

计算公式如下:

29111604_EVfq.jpg

29111604_UEOy.jpg

double maxneg = -DBL_MAX, minpos = DBL_MAX;
SVM *svm = &bundle->svm;
for (unsigned i = 0; i < count; ++i)
{
	double wx = kernel(svm->weight, data[i], DIMISION);
	if (y[i] == POS && minpos > wx)
		minpos = wx;
	else if (y[i] == NEG && maxneg < wx)
		maxneg = wx;
}
svm->bias = -(minpos + maxneg) / 2;

代码地址:http://git.oschina.net/fanwenjie/SVM-iris/

转载于:https://my.oschina.net/fanwj/blog/701452

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值