数据挖掘实验三：极限学习机（python实现）

最新推荐文章于 2024-06-09 23:34:55 发布

ChessZH

最新推荐文章于 2024-06-09 23:34:55 发布

阅读量2.8k

点赞数 1

分类专栏：学习记录文章标签：数据挖掘 python 神经网络

本文链接：https://blog.csdn.net/xiangQiAtCSDN/article/details/118016814

版权

学习记录专栏收录该内容

13 篇文章 1 订阅

订阅专栏

实验内容

实验背景介绍

相比较其他传统的神经元网络算法，极限学习机基于单隐层前馈神经网络，具有速度快、易于实现、泛化能力强等优势。对于任意输入集合，随机设定输入层结点到隐含层的权重值以及隐含层偏差后，具有h个隐含层结点的单隐层前馈神经网络几乎能以任意区间、无限可导的非零激活函数，逼近任何一个连续的函数。极限学习机工作结构如图1所示。
图1 极限学习机的网络结构

激活函数可以是任意无限可到、值域在(0,1)之中的函数，如图2所示。
在这里插入图片描述

图2 极限学习机的一种激活函数
我们这里把这个激活函数固定下来，如下所示。
$\frac{1}{1+e^{-z}}$
图1中，输入层和隐含层之间有权重；隐含层和输出层之间也有权重。但是，输入层和隐含层之间的权重可以随机设定，包括截距！这是极限学习机和普通的神经元网络最大的不同之处。
假设一共有n行输入，而隐含层的节点数量（是输入变量数量的2~3倍左右）有h个，根据已经设定的权重，我们会有：
$H_{i,1},H_{i,2},......,H_i,Q_i), i = 1,2,...,n$
对于数据集中的第i个输入，Hi,j是各个隐含节点的输出， Qi是第i个真实输出值。注意，所有输入节点汇聚到一个节点之后，除了乘以加权系数之外，还要有一个截距。
假设隐含节点的各个输出到最终输出之间的连接权重是wj, j=1, 2, …, h，则我们要求得一组w，使得下式取得最小值：
在这里插入图片描述

求解这一最小值问题，恰好就是最小二乘法的功能。其中d是截距。求解这一问题的解法是：
在这里插入图片描述

式(4)中的H要比(3)中的H多一个变量d。

输入输出及具体要求

建立极限学习机之后，对附件中训练数据进行训练，获得极限学习机的网络结构和模型，然后对预测数据进行预测。
预测数据一共10条，通过预测，会得到10个预测结果，这些结果要用文本的形式在一行中显示。为了和真实结果进行对比，不能用图片的形式显示预测结果。
实验报告中要有训练数据的模型结果和真实结果差的平方的平均值，然后求平方根之后的结果。

训练及测试数据

太多了，自己编吧，老师给的数据7个属性1个标签

源程序

matrix.py用于自定义矩阵

class MyMatrix(object):

    def __init__(self, row, column, value=0):
        self.row = row
        self.column = column
        if value == 0:
            self._matrix = [0.0 for i in range(row * column)]
        else:
            assert len(value) == row * column, '赋值数量不匹配'
            self._matrix = list(value)

    # 重写中括号引用
    def __getitem__(self, index):
        if isinstance(index, int):
            assert index <= self.row, str(index) + ' ' + str(self.row) + ' index超了'
            row = []
            for i in range(self.column):
                row.append(self._matrix[self.column * (index - 1) + i])
            return row
        elif isinstance(index, tuple):
            assert index[0] <= self.row and index[1] <= self.column, str(index[0]) + ' ' + str(self.row) + ' ' + str(
                index[1]) + ' ' + str(self.column) + ' index超了'
            return self._matrix[self.column * (index[0] - 1) + index[1] - 1]

    # m[i, 0] ~ m[i, j] = value，给矩阵第i行赋值，list或tuple
    # m[i, j] = value
    def __setitem__(self, index, value):
        if isinstance(index, int):
            assert index <= self.row, str(index) + ' ' + str(self.row) + ' index超了'
            for i in range(self.column):
                self._matrix[self.column * (index - 1) + i] = value[i]
        elif isinstance(index, tuple):
            assert index[0] <= self.row and index[1] <= self.column, str(index[0]) + ' ' + str(self.row) + ' ' + str(
                index[1]) + ' ' + str(self.column) + ' index超了'
            self._matrix[self.column * (index[0] - 1) + index[1] - 1] = value

    # A * B (A * 2.0)
    def __mul__(A, B):
        # 矩阵乘以一个数
        if isinstance(B, int) or isinstance(B, float):
            temp = MyMatrix(A.row, A.column)
            for r in range(1, A.row + 1):
                for c in range(1, A.column + 1):
                    temp[r, c] = A[r, c] * B
        else:
            # 矩阵乘以矩阵
            assert A.column == B.row, str(A.row) + str(A.column) + str(B.row) + str(B.column) + '维度不匹配,不能相乘'
            temp = MyMatrix(A.row, B.column)
            for r in range(1, A.row + 1):
                for c in range(1, B.column + 1):
                    sum = 0
                    for k in range(1, A.column + 1):
                        sum += A[r, k] * B[k, c]
                    temp[r, c] = sum
        return temp

    # A + B
    def __add__(A, B):

        assert A.row == B.row and A.column == B.column, str(A.row) + str(A.column) + str(B.row) + str(
            B.column) + '维度不匹配，不能相加'
        temp = MyMatrix(A.row, A.column)
        for r in range(1, A.row + 1):
            for c in range(1, A.column + 1):
                temp[r, c] = A[r, c] + B[r, c]
        return temp

    # print(M)
    def __str__(self):
        out = ""
        for r in range(1, self.row + 1):
            for c in range(1, self.column + 1):
                out = out + str(self[r, c]) + ' '
            out += "\n"
        return out

        # A(T)，求矩阵的转置

    def transpose(self):
        trans = MyMatrix(self.column, self.row)
        for r in range(1, 1 + self.column):
            for c in range(1, 1 + self.row):
                trans[r, c] = self[c, r]
        return trans

    # 求逆
    def invert(self):
        # assert self.row == self.column, "不是方阵"
        inv2 = MyMatrix(self.row, self.column * 2)
        # 构造 n * 2n 的矩阵
        for r in range(1, 1 + inv2.row):
            doub = self[r]
            for i in range(1, 1 + inv2.row):
                if i == r:
                    doub.append(1)
                else:
                    doub.append(0)
            inv2[r] = doub
        # 初等行变换
        for r in range(1, inv2.row + 1):
            # 判断矩阵是否可逆
            if inv2[r, r] == 0:
                for rr in range(r + 1, inv2.row + 1):
                    if inv2[rr, r] != 0:
                        inv2[r], inv2[rr] = inv2[rr], inv2[r]
                    break
            # assert inv2[r, r] != 0, '矩阵不可逆'
            temp = inv2[r, r]
            for c in range(r, inv2.column + 1):
                inv2[r, c] /= temp
            for rr in range(1, inv2.row + 1):
                temp = inv2[rr, r]
                for c in range(r, inv2.column + 1):
                    if rr == r:
                        continue
                    inv2[rr, c] -= temp * inv2[r, c]

        inv = MyMatrix(inv2.row, inv2.row)
        for i in range(1, 1 + inv.row):
            doub = inv2[i]
            inv[i] = doub[inv.row:]
        return inv

model.py用于训练模型

from matrix import MyMatrix
import math
import random


# 最小二乘法
def least_square_method(H, Q):
    return (H.transpose() * H).invert() * H.transpose() * Q


class ELM(object):

    def __init__(self, inputSize, outputSize, bit):

        self.inputSize = inputSize
        self.outputSize = outputSize

        # hiddensize取变量的2～3倍
        self.hiddenSize = bit * 2
        self.bit = bit
        self.H = 0
        self.w = 0
        # 随机出bit * hiddensize的weight权重
        ran = [random.uniform(-0.2, 0.2) for i in range(self.bit * self.hiddenSize)]
        self.weight = MyMatrix(self.bit, self.hiddenSize, ran)
        # 随机出hiddensize * 1的bias截距
        ran = [random.uniform(0, 1) for i in range(self.hiddenSize)]
        self.bias = MyMatrix(self.hiddenSize, 1, ran)

    # 实验要求中指定的函数
    def sigmoid(self, x):
        return 1 / (1 + math.e ** (x * -1))

    def train(self, X, Q):
        # 隐含层输出H inputsize * hiddensize
        self.H = X * self.weight
        # 激活函数，H仍然是inputsize * hiddensize
        for r in range(1, 1 + self.H.row):
            for c in range(1, 1 + self.H.column):
                self.H[r, c] = self.sigmoid(self.H[r, c] + self.bias[c, 1])
        # 最小二乘法求w
        self.w = least_square_method(self.H, Q)

        # 返回
        return self.H * self.w

    def predict(self, X):
        # 隐含层输出
        self.H = X * self.weight
        # 激活函数
        for r in range(1, 1 + self.H.row):
            for c in range(1, 1 + self.H.column):
                self.H[r, c] = self.sigmoid(self.H[r, c] + self.bias[c, 1])

        return self.H * self.w

use_model.py用于使用模型，进行预测

import numpy as np

from model import ELM
from matrix import MyMatrix

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score


# 矩阵格式变成我们自定义的矩阵类
def reshapeX(row, column, ij):
    li = []
    for i in ij:
        for j in i:
            li.append(float(j))
    return MyMatrix(int(row), int(column), li)


# 矩阵格式变成我们自定义的矩阵类
def reshapeY(row, ij):
    li = []
    for i in ij:
        li.append(float(i))
    return MyMatrix(int(row), 1, li)


if __name__ == '__main__':

    # 从train.txt读数据到X_train,Y_train
    X_train = []
    Y_train0 = []

    file = open('train.txt', 'r')
    while True:
        line = file.readline()
        if line:
            # 去掉空格
            line.replace(" ", "")
            # 分隔
            temp_x = line.split(',')
            temp_x2 = []
            for i in temp_x:
                temp_x2.append(float(i))
            X_train.append(temp_x2[:-1])
            Y_train0.append(temp_x2[-1])
        else:
            break
    file.close()
    # print(X_train)
    # print(Y_train)

    # 从predict.txt读数据到X_test
    X_test = []
    file = open('predict.txt', 'r')
    while True:
        line = file.readline()
        if line:
            # 去掉空格
            line.replace(" ", "")
            # 分隔
            temp_pre_x = line.split(',')
            temp_pre_x2 = []
            for i in temp_pre_x:
                temp_pre_x2.append(float(i))
            X_test.append(temp_pre_x2)
        else:
            break
    file.close()
    # print(X_test)

    # 输入7，输出1
    elm = ELM(7, 1, 7)

    X_train = reshapeX(len(X_train), len(X_train[0]), X_train)
    X_test = reshapeX(len(X_test), len(X_test[0]), X_test)
    Y_train = reshapeY(len(Y_train0), Y_train0)

    elm.train(X_train, Y_train)
    Y_predict = elm.predict(X_test)
    # print(type(Y_predict))
    # print(Y_predict)

    li = []
    for i in range(1, Y_predict.row + 1):
        for j in range(1, Y_predict.column + 1):
            li.append(Y_predict[i, j])
    Y_predict = np.array(li)
    print(Y_predict)

    # 计算差方均值的平方根
    Y_predict2 = elm.predict(X_train)
    li = []
    for i in range(1, Y_predict2.row + 1):
        for j in range(1, Y_predict2.column + 1):
            li.append(Y_predict2[i, j])
    Y_predict2 = np.array(li)
    # print(Y_predict2)

    ans = 0
    for i in range(0, len(Y_predict2)):
        square_delta = (Y_predict2[i] - Y_train0[i]) ** 2
        # print(square_delta)
        ans += square_delta
    ans /= len(Y_predict2)
    ans = ans ** 0.5
    print(ans)

    ans2 = 0  # 修正异常数据
    normal_num = 0  # 计数（正常个数）
    for i in range(0, len(Y_predict2)):
        square_delta = (Y_predict2[i] - Y_train0[i]) ** 2
        # print(square_delta)
        if square_delta < 1.5:
            ans2 += square_delta
            normal_num += 1
    ans2 /= normal_num
    ans2 = ans2 ** 0.5
    print(ans2)

ChessZH

关注

1
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘实验三：极限学习机（python实现）

目录实验内容实验背景介绍输入输出及具体要求训练及测试数据源程序matrix.py用于自定义矩阵model.py用于训练模型use_model.py用于使用模型，进行预测实验内容实验背景介绍相比较其他传统的神经元网络算法，极限学习机基于单隐层前馈神经网络，具有速度快、易于实现、泛化能力强等优势。对于任意输入集合，随机设定输入层结点到隐含层的权重值以及隐含层偏差后，具有h个隐含层结点的单隐层前馈神经网络几乎能以任意区间、无限可导的非零激活函数，逼近任何一个连续的函数。极限学习机工作结构如图1所示。激活
复制链接

扫一扫

专栏目录