基于麻雀算法优化的相关向量机RVM分类算法

智能算法研学社（Jack旭）

已于 2022-05-06 21:56:43 修改

阅读量1.5k

点赞数 1

分类专栏：智能优化算法应用机器学习文章标签：算法机器学习深度学习人工智能

于 2021-07-24 16:11:32 首次发布

本文链接：https://blog.csdn.net/u011835903/article/details/119005293

版权

智能优化算法应用同时被 2 个专栏收录

3593 篇文章 369 订阅

订阅专栏

机器学习

1950 篇文章 38 订阅

订阅专栏

本文探讨了使用麻雀算法优化相关向量机(RVM)的宽度因子和超参数，以提高分类性能。在训练集和测试集上，经过优化的SSA-RVM相比于原始RVM，取得了更高的准确率，分别为0.97和0.88235。实验基于250组11维数据，其中200组用于训练，50组用于测试，结果显示SSA-RVM在训练和测试集上的表现更优。

摘要由CSDN通过智能技术生成

基于麻雀算法优化的相关向量机RVM分类算法

文章目录

基于麻雀算法优化的相关向量机RVM分类算法

摘要：本文主要介绍相关向量机RVM的基本原理，以及利用麻雀算法改进RVM在分类问题中的应用。

1.RVM原理

RVM算法是一种基于贝叶斯框架的机器学习模型，通过最大化边际似然得到相关向量和权重。

设 ${x\}_{u=1}^N$ 和 ${t\}_{u=1}^N$ 分别是输入向量和输出向量，目标 $t$ 可采用如式(1)所示的回归模型获得:
$=y(x)+\xi_n \tag{1}$
式中: $\xi_n$ 为零均值、方差 $σ^2$ 的噪声， $y (x)$ 定义为:
$y(x)=\sum_{u=1}^Nw_uK(x,x_u)+w_0 \tag{2}$
式中: $K(x,x_u)$ 是核函数， $w_u$ 是权重向量， $w_0$ 是偏差。设 $t$ 是独立的，其概率定义为:
$p(t|w,\sigma^2)=(2\pi\sigma^2)^{-N/2}exp(-\frac{||t-w\varphi||^2}{2\sigma^2})\tag{3}$
式中： $t=(t_1,t_2,...,t_N)^T,w=(w_0,w_1,...,w_n)^T$ , $\varphi$ 是 $N (N + 1)$ 的矩阵。

式(3)中的 $w$ 和 $σ$ 最大似然估计会导致过拟合，为约束参数，定义一个零均值高斯先验概率分布:
$p(w|\alpha)=\prod_{u=0}^NN(w_u|0,\alpha_u^{-1})\tag{4}$
式中: $α$ 是 $N + 1$ 维的超参数向量。

依据贝叶斯公式，未知参数的后验概率为:
$p(w,\alpha,\sigma^2|t)=p(w|\alpha,\sigma^2,t)p(\alpha,\sigma^2|t)\tag{5}$
后验分布的权重被描述为:
$p(w|t,\alpha,\sigma^2)=(2\pi)^{-(N+1)/2}|\Sigma|^{-1/N}exp(-\frac{1}{2}(w-u)^T\Sigma ^{-1}(w-u))\tag{6}$
式中:后验均值 $u=\sigma^{-2}\Sigma\varphi^Tt$ ,协方差 $\Sigma=(\sigma^{-2}\varphi^T\varphi+A)^{-1}$ , $A=diag(\alpha_0,\alpha_1,...,\alpha_N)$ 。

为了实现统一的超参数，做出如下定义:
$p(t|\alpha,\sigma^2)=\int p(t|w,\sigma^2)p(w,\alpha)dw =(2\pi)^{-N/2}|\sigma^2I+\varphi A^{-1}\varphi^T|exp(-\frac{1}{2}t^T(\sigma^2I + \varphi A^{-1}\varphi^T)^{-1}t)\tag{7}$
高斯径向基函数具有较强的非线性处理能力，被用作核函数，其定义如下:
$K(x,x_u)=exp(-\frac{(x-x_u)^2}{2\gamma^2})\tag{7}$
式中: $γ$ 为宽度因子，对模型的精度有极大的影响，需要预先设定。

2.基于麻雀算法优化的相关向量机RVM

麻雀算法的基本原理请参考我的博客：https://blog.csdn.net/u011835903/article/details/108830958

本文利用麻雀算法优化RVM的宽度因子和超参数。适应度函数设计为训练集和验证集的错误率之和。错误率越低表明算法的预测性能越好。
$\tag{8}$

3.算法实验与结果

本文算法数据数量一共为250组数据，2个类别数据。其中前200组数据用训练，后50组数据用作测试数据。数据的输入维度为11维。

数据类别	数据量
训练数据	200
测试数据	50

麻雀算法的参数设置如下：

%% 麻雀参数设置
pop=20; %种群数量
Max_iteration=20; %  设定最大迭代次数
dim = 2;% 维度为2，即优化一个超参数，以及核宽度
lb = [0.1,0.1];%下边界
ub = [1,10];%上边界

得到的结果如下图所示：
请添加图片描述

请添加图片描述

RVM训练集准确率：0.955
RVM测试集准确率：0.84314
SSA-RVM训练集准确率：0.97
SSA-RVM测试集准确率：0.88235

从结果来看，SSA-RVM的结果无论是在训练集还是测试集上结果都更优。

4.参考文献：

[1] TIPPPING M E． Sparse Bayesian learning and the relevance vector machine［J］． The journal of machine learning research，2001，1: 211-244．

5.MATLAB代码

在这里插入图片描述

智能算法研学社（Jack旭）

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录