这个学期要学DM&ML,用的是《数据挖掘算法原理与实现》王振武 本着造福同学的思想,开一个DM&ML的笔记系列,打算给书上的源代码添加一点注释,方便阅读和理解
前置知识要求
C++
SOM网络设计
注意,请仔细看这一部分的设计,这里写的是源码的相关参数,书上P191写的是例子的参数,有所不同。
1.输入层结点数:样本维度=7*5
2.输出层结点数:取96个神经元构成8*12的二维平面阵。
3.权值初始化:随机归一化小数
4.领域半径:
r(t+1)=r(t)*(1-当前迭代数n/总迭代数N),t>1
r(t)=Max_size of outputLayer,t=1
5.学习率:
a(t+1)=a(t)*(1-当前迭代数n/总迭代数N),t>1
a(t)=default efficiency,t=1
具体实现
#include <fstream>
#include <string>
#include <iomanip>
#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
using namespace std;/*hiro:忘记声明命名空间*/
#define InputLayerNum 35
#define OutputLayerRow 8
#define OutputLayerColumn 12
#define total_iteration_Num 1000000//10000//80//100//1000
#define error_limit 0.0000000000008//0.1//0.0000000000008//0.000000000000008//0.0001
#define efficiency 0.9//0.3//0.9//0.3//0.9
#define is_win true
/*hiro:添加全局的字符-下标转换数组,真是的,该全局的不全局,,,写函数也好啊。。。*/
const string character = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
/*hiro:写在前面,我真的想不懂为何一堆应该局部的变量写全局,,偷懒也不是这么偷的啊。。。
而且该全局可以偷懒的又不写,,*/
int i,j,k,l,m,n;
int inputMode[26][7][5];
/*hiro:↓↓修改了原本不友好的写法*/
double weight[OutputLayerRow][OutputLayerColumn][InputLayerNum];
/*hiro:记录迭代次数*/
int current_iteration_num=0;
/*hiro:当前学习效率*/
double study_efficiency=efficiency;
/*hiro:↓↓修改了原本不友好的写法*/
/*hiro:这个变量的名字应该和一些库文件里的声明冲突了,遂更改为my_distance*/
long double my_distance[OutputLayerRow][OutputLayerColumn];
/*hiro:保存了当前时刻的结点影响范围*/
int neighbor_width=OutputLayerColumn;
int neighbor_height=OutputLayerRow;
/*hiro:姑且是保存了所有获胜节点的下标,但是并没有用上
后面它又通过遍历的方法来获取获胜结点的下标。。*/
int row[OutputLayerRow], column[OutputLayerColumn];
/*hiro:改为bool 型更符合语意,保存了该下标是否为获胜节点*/
bool flag[OutputLayerRow][OutputLayerColumn];
int temp_row,temp_column;
int winner_row,winner_column;
long double min_distance=1000.0;
/****************************************************************/
//该函数初始化距离变量为0,初始化保存胜出节点的位置的变量
/****************************************************************/
void init_distance()
{
for(i=0;i<OutputLayerRow;i++)
for(j=0;j<OutputLayerColumn;j++)
my_distance[i][j]=0.0;
}
/*hiro:增加函数用于处理范围参数
for_weight字段用来判断在weight_change函数里需要额外进行的操作*/
void legalizeInput(int &ttLow, int & ttUp, int &ppLow,