简单易学的机器学习算法——极限学习机(ELM)

最新推荐文章于 2024-03-16 10:43:36 发布

贺二公子

最新推荐文章于 2024-03-16 10:43:36 发布

阅读量2.5w

点赞数 5

分类专栏： [算法] 文章标签： ELM

[算法] 专栏收录该内容

14 篇文章 3 订阅

订阅专栏

一、极限学习机的概念

　　极限学习机(Extreme Learning Machine) ELM，是由黄广斌提出来的求解单隐层神经网络的算法。
　　ELM最大的特点是对于传统的神经网络，尤其是单隐层前馈神经网络(SLFNs)，在保证学习精度的前提下比传统的学习算法速度更快。

二、极限学习机的原理

　　ELM是一种新型的快速学习算法，对于单隐层神经网络，ELM可以随机初始化输入权重和偏置并得到相应的输出权重。
这里写图片描述
　　　　　　　　　　(选自黄广斌老师的PPT)
　　对于一个单隐层神经网络(见Figure 1)，假设有 $Ｎ$ 个任意的样本( $X_i,t_i$ )，其中 $X_i = [x_{i1}, x_{i2}, ..., x_{in}]^T \in R^n$ ， $t_i = [t_{i1}, t_{i2}, ..., t_{im}]^T \in R^m$ 。对于一个有 $L$ 个隐层节点的单隐层神经网络可以表示为

\sum i = 1 L β i g (W i \cdot X j + b i) = o j, j = 1, . . ., N

$\sum_{i=1}^L \beta_ig(W_i · X_j + b_i) = o_j, j = 1, ..., N$
　　其中，

g(x) $g(x)$ 为激活函数，

Wi=[wi1,wi2,...,win]T $W_i = [w_{i1}, w_{i2}, ..., w_{in}]^T$ 为输入权重，

βi $\beta_i$ 输出权重，

bi $b_i$ 是第

i $i$ 个隐层单元的偏置。

Wi⋅Xj $W_i · X_j$ 表示

Wj $W_j$ 和

Xj $X_j$ 的内积。
　　单隐层神经网络学习的目标是使得输出的误差最小，可以表示为

\sum j = 1 N | | o j - t j | | = 0

$\sum_{j=1}^N ||o_j - t_j|| = 0$
　　即存在

βi $\beta_i$ ，

Wi $W_i$ 和

bi $b_i$ ，使得

\sum i = 1 L β i g (W i \cdot X j + b i) = t j, j = 1, . . ., N

$\sum_{i=1}^L \beta_ig(W_i · X_j + b_i) = t_j, j = 1, ..., N$
　　可以矩阵表示为

H β = T

$H\beta = T$
　　其中，

H $H$ 是隐层节点的输出，

β $\beta$ 为输出权重，

T $T$ 为期望输出。

H (W 1, . . ., W L, b 1, . . ., b L, X 1, . . ., X L) = ⎡ ⎣ ⎢ ⎢ g (W 1 \cdot X 1 + b 1) \dots g (W L \cdot X 1 + b L) ⋮ \dots ⋮ g (W 1 \cdot X N + b 1) \dots g (W L \cdot X N + b L) ⎤ ⎦ ⎥ ⎥ N \times L

$H(W_1, ..., W_L, b_1, ..., b_L, X_1, ..., X_L) = \left[\begin{matrix}g(W_1 · X_1 + b_1)\quad \cdots\quad g(W_L · X_1 + b_L)\\\vdots\qquad \cdots\qquad \vdots\\g(W_1 · X_N + b_1)\quad \cdots\quad g(W_L · X_N + b_L)\end{matrix}\right]_{N×L}$

β = ⎡ ⎣ ⎢ ⎢ β T 1 ⋮ β T L ⎤ ⎦ ⎥ ⎥ L \times m, T = ⎡ ⎣ ⎢ ⎢ T T 1 ⋮ T T L ⎤ ⎦ ⎥ ⎥ L \times m

$\beta = \left[\begin{matrix}\beta_1^T\\\vdots\\\beta_L^T\end{matrix}\right]_{L×m}, T = \left[\begin{matrix}T_1^T\\\vdots\\T_L^T\end{matrix}\right]_{L×m}$
　　为了能够训练单隐层神经网络，我们希望得到

W^i $\hat{W}_i$ ，

b^i $\hat{b}_i$ 和

β^i $\hat{\beta}_i$ ，使得

| | H (W^i, b^i) β^i - T | | = min W, b, β | | H (W i, b i) β i - T | |

$||H(\hat{W}_i, \hat{b}_i)\hat{\beta}_i - T|| = \min_{W,b,\beta}||H(W_i, b_i)\beta_i - T||$
　　其中，

i=1,...,L $i = 1, ..., L$ ，这等价于最小化损失函数

E = \sum j = 1 N (\sum i = 1 L β i g (W i \cdot X j + b i) - t j) 2

$E = \sum_{j=1}^N(\sum_{i=1}^L \beta_ig(W_i · X_j + b_i) - t_j)^2$
　　传统的一些基于梯度下降法的算法，可以用来求解这样的问题，但是基本的基于梯度的学习算法需要在迭代的过程中调整所有参数。而在ELM算法中, 一旦输入权重

Wi $W_i$ 和隐层的偏置

bi $b_i$ 被随机确定，隐层的输出矩阵

H $H$ 就被唯一确定。训练单隐层神经网络可以转化为求解一个线性系统

Hβ=T $H\beta = T$ 。并且输出权重

β $\beta$ 可以被确定

β^= H + T

$\hat\beta = H^+T$
　　其中，是矩阵的Moore-Penrose广义逆。且可证明求得的解的范数是最小的并且唯一。

三实验

　　我们使用《简单易学的机器学习算法——Logistic回归》中的实验数据。
这里写图片描述
　　　　　　　　　　　　原始数据集
　　我们采用统计错误率的方式来评价实验的效果，其中错误率公式为：

e r r o r R a t e = N u m E r r o r N u m A l l

$errorRate = \frac{NumError}{NumAll}$

　　对于这样一个简单的问题， $errorRate = 0$ 。
　　MATLAB代码
　　主程序

%% 主函数，二分类问题  

%导入数据集  
A = load('testSet.txt');  

data = A(:,1:2);%特征  
label = A(:,3);%标签  

[N,n] = size(data);  

L = 100;%隐层节点个数  
m = 2;%要分的类别数  

%--初始化权重和偏置矩阵  
W = rand(n,L)*2-1;  
b_1 = rand(1,L);  
ind = ones(N,1);  
b = b_1(ind,:);%扩充成N*L的矩阵  

tempH = data*W+b;  
H = g(tempH);%得到H  

%对输出做处理  
temp_T=zeros(N,m);  
for i = 1:N  
    if label(i,:) == 0  
        temp_T(i,1) = 1;  
    else   
        temp_T(i,2) = 1;  
    end      
end  
T = temp_T*2-1;  

outputWeight = pinv(H)*T;  

%--画出图形  
x_1 = data(:,1);    
x_2 = data(:,2);    
hold on    
for i = 1 : N    
    if label(i,:) == 0    
        plot(x_1(i,:),x_2(i,:),'.g');    
    else    
        plot(x_1(i,:),x_2(i,:),'.r');    
    end    
end  

output = H * outputWeight;  
%---计算错误率  
tempCorrect=0;  
for i = 1:N  
    [maxNum,index] = max(output(i,:));  
    index = index-1;  
    if index == label(i,:);  
        tempCorrect = tempCorrect+1;  
    end  
end  

errorRate = 1-tempCorrect./N;

　　激活函数

function [ H ] = g( X )  
    H = 1 ./ (1 + exp(-X));  
end

黄老师提供的极限学习机的代码：http://www.ntu.edu.sg/home/egbhuang/elm_codes.html

贺二公子

关注

5
点赞
踩
91

收藏

觉得还不错? 一键收藏
4
评论
简单易学的机器学习算法——极限学习机(ELM)

一、极限学习机的概念　　极限学习机(Extreme Learning Machine) ELM，是由黄广斌提出来的求解单隐层神经网络的算法。　　ELM最大的特点是对于传统的神经网络，尤其是单隐层前馈神经网络(SLFNs)，在保证学习精度的前提下比传统的学习算法速度更快。二、极限学习机的原理　　ELM是一种新型的快速学习算法，对于单隐层神经网络，ELM可以随机初始化输入权重和偏置
复制链接

扫一扫