神经网络与深度学习(二)cpp-c++BP神经网络

最新推荐文章于 2024-06-18 09:46:52 发布

Mr_W1997

最新推荐文章于 2024-06-18 09:46:52 发布

阅读量1.1k

点赞数 1

分类专栏：学习笔记文章标签：神经网络与深度学习感知机

本文链接：https://blog.csdn.net/Mr_W1997/article/details/54849434

版权

学习笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

最新在这 http://blog.csdn.net/mr_w1997/article/details/54973376

读到作者用JAVA实现的神经网络解决异或等问题

以下为c++实现版本

接口略有不同

具体关键的更新的证明详见机器学习或大牛博客

有一个关键的地方是权值的初始化

原本是都初始化0 但是楼主也意识到这样无论怎样更新隐层不同神经元对应输入层同一神经元的权值都相同相当于仍然用一个线性函数划分不可线性划分的区域

思考良久就初始化为随机数了然而不行后来看了别人的初始化发现了这个

//关键的初始化权值
		for (int i = 0; i < lastlayerneunum; ++i)
			this->Last_weight[i] = (2.0*(double)rand() / RAND_MAX) - 1;

改了一下瞬间问题都没了也很神奇至于原因楼主开学要回去问学长有知道的大神也请赐教

一下为代码如有bug 欢迎指正

楼主有些懒成员函数的实现都在类内部了有点难看还请别介意

TransferFunc.h 激励函数类及类型的定义

//TransferFunc.h
//created by WK

#ifndef TRANSFERFUNC_H
#define TRANSFERFUNC_H

#include <cmath>

enum Functypes
{
	FUNCTYPE_TANH,
	FUNCTYPE_STEP,
	FUNCTYPE_LINEAR,
	FUNCTYPE_SIGMOID
};

class Function
{
private:
	double Step(double input)
	{
		if (input < 0)
			return 0;
		else
			return 1;
	}
	double Linear(double input)
	{
		return input;
	}
	double Sigmoid(double input)
	{
		return 1.0 / (1.0 + exp(-1.0*input));
	}
public:

	double GetResult(int funcType, double input)
	{
		switch (funcType)
		{
		case FUNCTYPE_TANH:
			return tanh(input);
		case FUNCTYPE_STEP:
			return Step(input);
		case FUNCTYPE_LINEAR:
			return Linear(input);
		case FUNCTYPE_SIGMOID:
			return Sigmoid(input);
		default:
			return input;
		}
	}
};

#endif // !TRANSFERFUNC_H

DataSet.h 数据集类型

//DateSet.h
//created by WK

#ifndef DATASET_H
#define DATASET_H

#include <vector>

using namespace std;

//数据集
class DataSet
{
private:
	int					InputNum;
	int					OutputNum;
	vector<double*>		DataMap;

public:
	DataSet(int inputnum, int outputnum)
	{
		this->InputNum = inputnum;
		this->OutputNum = outputnum;
	}
	void AddRow(double *inputArray, double *outputArray)
	{
		double *data = new double[this->InputNum + this->OutputNum];
		for (int i = 0; i<this->InputNum; ++i)
		{
			data[i] = inputArray[i];
		}
		for (int i = 0; i<this->OutputNum; ++i)
		{
			data[InputNum + i] = outputArray[i];
		}
		this->DataMap.push_back(data);
	}
	int GetInputNum()
	{
		return this->InputNum;
	}
	int GetOutputNum()
	{
		return this->OutputNum;
	}
	int GetRows()
	{
		return DataMap.size();
	}
	vector<double*> GetDataMap()
	{
		return DataMap;
	}
 
};


#endif // !DATASET_H

MultiLayerPerceptron.cpp神经元定义以及单隐层神经网络定义以及异或问题的解决

#include <vector>
#include <iostream>
#include "TransferFunc.h"
#include "DataSet.h"
#include <time.h>
#include <cstdlib>

using namespace std;

#define WINITVALUE 0.001
#define TINITVALUE 0

//神经元
class Neuron
{
private:
	double				Input;
	double				Output;
	double				Threshold;
	double				*Last_weight;			//神经元维护后向的权重
	int					LastLayerNeuNum;
	int					TransferFunctionType;
	Function			Transferfunction;

public:
	Neuron(double threshold, int lastlayerneunum, int funcType)
	{
		this->Input					=	0;
		this->Output				=	0;
		this->Threshold				=	threshold;
		this->LastLayerNeuNum		=	lastlayerneunum;
		this->TransferFunctionType	=	funcType;
		this->Last_weight			=	new double[lastlayerneunum];
		//关键的初始化权值
		for (int i = 0; i < lastlayerneunum; ++i)
			this->Last_weight[i] = (2.0*(double)rand() / RAND_MAX) - 1;
		
	}
	void SetInput(double input)
	{
		this->Input = input;
	}
	double GetOutput()
	{
		this->Output = Transferfunction.GetResult(this->TransferFunctionType, this->Input - this->Threshold);

		return this->Output;
	}
	double* GetThreshold()
	{
		return &this->Threshold;
	}
	double *GetWeight()
	{
		return this->Last_weight;
	}
	void SetFuncType(int functype)
	{
		this->TransferFunctionType = functype;
	}
};

//多层感知机
class MultiLayerPerceptron
{
private:
	int			OutTransfetFunctionType;
	int			HideTransfetFunctionType;
	int			InTransfetFunctionType;
	int			InLayerNeuNum;
	int			HideLayerNeuNum;
	int			OutLayerNeuNum;
	double		Speed;
	Neuron		**InputNeurons;
	Neuron		**OutputNeurons;
	Neuron		**HidenNeurons;
public:

	MultiLayerPerceptron(int intransferfunctiontype, int inLayerNeuNum, int hidetransferfunctiontype, int hideLayerNeuNum, int outtransferfunctiontype, int outLayerNeuNum, double speed)
	{
		this->InTransfetFunctionType	=	intransferfunctiontype;
		this->HideTransfetFunctionType	=	hidetransferfunctiontype;
		this->OutTransfetFunctionType	=	outtransferfunctiontype;
		this->InLayerNeuNum				=	inLayerNeuNum;
		this->HideLayerNeuNum			=	hideLayerNeuNum;
		this->OutLayerNeuNum			=	outLayerNeuNum;
		this->Speed						=	speed;

		this->InputNeurons	= (Neuron**)new void*[inLayerNeuNum];
		for (int i = 0; i < inLayerNeuNum; ++i)
			this->InputNeurons[i] = new Neuron(TINITVALUE, 0, intransferfunctiontype);
		this->HidenNeurons	= (Neuron**)new void*[hideLayerNeuNum];
		for (int i = 0; i < hideLayerNeuNum; ++i)
			this->HidenNeurons[i] = new Neuron(TINITVALUE, inLayerNeuNum, hidetransferfunctiontype);
		this->OutputNeurons = (Neuron**)new void*[outLayerNeuNum];
		for (int i = 0; i < outLayerNeuNum; ++i)
			this->OutputNeurons[i] = new Neuron(TINITVALUE, hideLayerNeuNum, outtransferfunctiontype);
	}
	//获取正向的输出
	void GetOutput(double *output)
	{
		double sum;

		for (int i = 0; i < this->HideLayerNeuNum; ++i)
		{
			sum = 0;
			for (int j = 0; j < this->InLayerNeuNum; ++j)
				sum += this->HidenNeurons[i]->GetWeight()[j] * this->InputNeurons[j]->GetOutput();
			this->HidenNeurons[i]->SetInput(sum);
		}
		for (int i = 0; i < this->OutLayerNeuNum; ++i)
		{
			sum = 0;
			for (int j = 0; j < this->HideLayerNeuNum; ++j)
				sum += this->OutputNeurons[i]->GetWeight()[j] * this->HidenNeurons[j]->GetOutput();
			this->OutputNeurons[i]->SetInput(sum);
			output[i] = this->OutputNeurons[i]->GetOutput();
		}
	}

	//学习所有数据一次更新权值以及阈值
	void Learn(DataSet *trainingSet)
	{
		double *expect;
		double *data;
		double *output = new double[this->OutLayerNeuNum];
		for (int i = 0; i < trainingSet->GetRows(); ++i)
		{
			data	= trainingSet->GetDataMap()[i];
			expect	= data + trainingSet->GetInputNum();
			for (int j = 0; j < trainingSet->GetInputNum(); ++j)
				this->InputNeurons[j]->SetInput(data[j]);
			this->GetOutput(output);
			//更改隐藏层到输出层权重以及阈值
			//更新公式详见机器学习
			for (int j = 0; j < this->OutLayerNeuNum; ++j)
			{		
				double delta = this->Speed * output[j] * (1 - output[j]) * (expect[j] - output[j]);

				for (int k = 0; k < this->HideLayerNeuNum; ++k)
					this->OutputNeurons[j]->GetWeight()[k] += (delta * this->HidenNeurons[k]->GetOutput());
				*this->OutputNeurons[j]->GetThreshold() -= delta;
			}
			//更改输入层到隐藏层的权重以及阈值
			//更新公式详见机器学习
			for (int j = 0; j < this->HideLayerNeuNum; ++j)
			{
				double t = 0;
				for (int k = 0; k < this->OutLayerNeuNum; ++k)
					t += (this->OutputNeurons[k]->GetWeight()[j] * output[k] * (1 - output[k])*(expect[k] - output[k]));
				double delta = this->HidenNeurons[j]->GetOutput() * (1 - this->HidenNeurons[j]->GetOutput()) * t;
				for (int k = 0; k < this->InLayerNeuNum; ++k)
					this->HidenNeurons[j]->GetWeight()[k] += (this->Speed * this->InputNeurons[k]->GetOutput() * delta);
				*this->HidenNeurons[j]->GetThreshold() -= (this->Speed * delta);
			}
		}
	}

	void Test(DataSet *trainingSet)
	{
		double *output = new double[this->OutLayerNeuNum];
		double *expect = new double[this->OutLayerNeuNum];
		
		for (int i = 0; i < trainingSet->GetRows(); ++i)
		{
			for (int j = 0; j < trainingSet->GetInputNum(); ++j)
				this->InputNeurons[j]->SetInput(trainingSet->GetDataMap()[i][j]);
			this->GetOutput(output);
			for (int j = 0; j < trainingSet->GetOutputNum(); ++j)
			{
				cout << "output: ";
				cout << output[j] << "\t";
				cout << "expect: ";
				cout << trainingSet->GetDataMap()[i][trainingSet->GetInputNum()+j]<<"\t";
			}
			cout << endl;
		} 
		cout << endl;
		cout << "in to hide W:" << endl;
		for (int i = 0; i < this->HideLayerNeuNum; ++i)
		{
			for (int j = 0; j < this->InLayerNeuNum; ++j)
			{
				cout << this->HidenNeurons[i]->GetWeight()[j] << "  ";
			}
			cout << endl;
		}
		cout << endl;
		cout << "hide to out W:" << endl;
		for (int i = 0; i < this->OutLayerNeuNum; ++i)
		{
			for (int j = 0; j < this->HideLayerNeuNum; ++j)
			{
				cout << this->OutputNeurons[i]->GetWeight()[j] << "  ";
			}
			cout << endl;
		}
	}
};

int main()
{
	DataSet *trainingSet = new DataSet(2, 1);
	trainingSet->AddRow(new double[2]{ 1,1 }, new double[1]{ 0 });
	trainingSet->AddRow(new double[2]{ 1,0 }, new double[1]{ 1 });
	trainingSet->AddRow(new double[2]{ 0,1 }, new double[1]{ 1 });
	trainingSet->AddRow(new double[2]{ 0,0 }, new double[1]{ 0 });

	//层激励函数类型 神经元个数... 学习速率
	MultiLayerPerceptron *m = new MultiLayerPerceptron(FUNCTYPE_LINEAR, 2, FUNCTYPE_SIGMOID, 5, FUNCTYPE_SIGMOID, 1, 0.9);

	//学习1000次
	for (int i = 0; i < 10000; ++i)
		m->Learn(trainingSet);

	m->Test(trainingSet);

	

	system("pause");

	return 0;
}

Mr_W1997

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
神经网络与深度学习(二)cpp-c++BP神经网络

读到作者用JAVA实现的神经网络解决异或等问题以下为c++实现版本接口略有不同具体关键的更新的证明详见机器学习或大牛博客有一个关键的地方是权值的初始化原本是都初始化0 但是楼主也意识到这样无论怎样更新隐层不同神经元对应输入层同一神经元的权值都相同相当于仍然用一个线性函数划分不可线性划分的区域思考良久就初始化为随机数了然而不行后来看了别人的初始化发现了这个
复制链接

扫一扫

专栏目录