确定性神经网络连子棋模型的训练(二)

本篇继续上篇的未完部分。前面介绍完了使用单个数据训练模型的例子,本篇继续介绍使用批量数据训练模型的例子。

2. 批量数据的训练

(1)创建项目并导入SDK

按照上一篇文章的介绍进行项目创建,并导入SDK,详细内容请参考上一篇。

(2)编码

整体代码分为四部分,即神经网络初始化、训练数据读取、网络模型训练、模型保存,其中的数据读取和模型训练两部分放在循环之中,以便读取一批的数据进行训练。整体的代码如下所示:

void main(void)
{
	FILE* pFile = NULL;
	char strFileName[256] = { 0 };
	int nPieces = 0;				//训练数据中(一局对弈)的棋子数
	int narrSteps[1000] = { 0 };	//对弈中从第一子到最后一子的信息:X坐标、Y坐标、落子者(黑为-1,白为1)
	int nFileIndexStart = 1;		//第一个数据文件的名称所对应的数字
	int* parrSteps = NULL;

	InitWithoutModelFile(15, 15, 5);

	sprintf(strFileName, "D:/Data/%d.txt", nFileIndexStart++);
	while ((pFile = fopen(strFileName, "r")) != NULL)
	{
		nPieces = 0;
		parrSteps = narrSteps;
		while (fscanf(pFile, "%d %d %d", parrSteps, parrSteps + 1, parrSteps + 2) == 3)
		{
			parrSteps += 3;
			nPieces++;
		}
		fclose(pFile);

		TrainNetwork(narrSteps, nPieces, 15, 15);

		sprintf(strFileName, "D:/Data/%d.txt", nFileIndexStart++);
	}

	SaveModel("D:/Model/model.mod");
}

首先,调用SDK的函数InitWithoutModelFile(15,15,5)进行神经网络初始化,此处表示从空模型初始化为15x15棋盘上的五子棋,若想在已有模型上进行追加训练,则调用的是InitFromModelFile()函数。若想训练的是六连子模型,则只需将第三个参数从5改为6即可。

然后,使用一个while循环来逐个打开和读取数据文件,并使用读取的数据调用TrainNetwork()函数来训练神经网络模型。为了便于循环读取批量的数据文件,需要将数据文件的名称按计数的方式进行命名,如下图所示:

此处的代码将从nFileIndexStart的值表示的那个文件开始依次读取文件,直到文件读取失败的时候退出循环,因而要保证所有的数据文件的名称对应的数字是连续的,若中间有一个数字没找到,则后续比该数字大的文件均不会读取。例如:若10.txt被删除掉了,则此处只会读去1.txt到9.txt文件进行训练,11.txt开始往后的都不会读取,非数字命名的文件也不会读取。

虽然本例是使用一批的数据来训练神经网络,但是,每读出一个数据文件就要调用一次训练函数TrainNetwork(),因而该函数的调用是放在循环内的。

最后,在模型训练结束之后调用SDK函数SaveModel()保存训练得到的模型。

(3)测试

至此为止,批量数据训练的例子已经编码完成,运行程序之后可以在D盘的Model目录下看到新训练出的模型文件model.mod,可以将该模型用于之前文章中介绍的“神经网络五子棋(家庭版)”等软件中进行测试。

本例的运行时间可能较长,尤其是数据量达到上万条之后,可能需要等待几个小时才能运行结束并生成模型文件,这可能导致等待中的茫然。为了让训练的人能够时刻把握进度,可以在循环中打印出当前正在处理的数据文件名称:

printf("%s\n", strFileName);

结果如下图所示:

(4)后续

批量数据训练网络模型的例程已经介绍完毕,其它的例程请继续关注后续文章。

本例的完整代码如下所示:


#include "stdio.h"

#include "Inter.h"
#pragma comment(lib, "AIWZQDll.lib")

void main(void)
{
	FILE* pFile = NULL;
	char strFileName[256] = { 0 };
	int nPieces = 0;				//训练数据中(一局对弈)的棋子数
	int narrSteps[1000] = { 0 };	//对弈中从第一子到最后一子的信息:X坐标、Y坐标、落子者(黑为-1,白为1)
	int nFileIndexStart = 1;		//第一个数据文件的名称所对应的数字
	int* parrSteps = NULL;

	InitWithoutModelFile(15, 15, 5);

	sprintf(strFileName, "D:/Data/%d.txt", nFileIndexStart++);
	while ((pFile = fopen(strFileName, "r")) != NULL)
	{
		printf("%s\n", strFileName);

		nPieces = 0;
		parrSteps = narrSteps;
		while (fscanf(pFile, "%d %d %d", parrSteps, parrSteps + 1, parrSteps + 2) == 3)
		{
			parrSteps += 3;
			nPieces++;
		}
		fclose(pFile);

		TrainNetwork(narrSteps, nPieces, 15, 15);

		sprintf(strFileName, "D:/Data/%d.txt", nFileIndexStart++);
	}

	SaveModel("D:/Model/model.mod");
}
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

De-Chang Wang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值