DM&ML_note.7-神经网络聚类算法：SOM

最新推荐文章于 2023-10-15 16:52:33 发布

hiro_csdn

最新推荐文章于 2023-10-15 16:52:33 发布

阅读量1.9k

点赞数

分类专栏： DM-ML 文章标签：数据挖掘 SOM 神经网络聚类

本文链接：https://blog.csdn.net/qq_24328101/article/details/53114410

版权

本文介绍了SOM（Self-Organizing Map）神经网络聚类算法，包括前置知识要求，如C++基础；详细阐述了SOM网络的设计，如输入层和输出层的结点数、权值初始化及领域半径、学习率设置；具体实现了算法，并对代码进行了优化，以提高可读性。在感想部分，作者提到算法在样例中的收敛速度快，可视化效果好，能有效展示数据的相关性和聚类特性。

摘要由CSDN通过智能技术生成

这个学期要学DM&ML，用的是《数据挖掘算法原理与实现》王振武本着造福同学的思想，开一个DM&ML的笔记系列，打算给书上的源代码添加一点注释，方便阅读和理解

前置知识要求

C++

SOM网络设计

注意，请仔细看这一部分的设计，这里写的是源码的相关参数，书上P191写的是例子的参数，有所不同。
1.输入层结点数：样本维度=7*5
2.输出层结点数：取96个神经元构成8*12的二维平面阵。
3.权值初始化：随机归一化小数
4.领域半径：

r(t+1)=r(t)*(1-当前迭代数n/总迭代数N),t>1
r(t)=Max_size of outputLayer,t=1

5.学习率：

a(t+1)=a(t)*(1-当前迭代数n/总迭代数N),t>1
a(t)=default efficiency,t=1

具体实现

#include <fstream>
#include <string>
#include <iomanip>
#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
using namespace std;/*hiro:忘记声明命名空间*/

#define InputLayerNum 35
#define OutputLayerRow 8
#define OutputLayerColumn 12
#define total_iteration_Num 1000000//10000//80//100//1000
#define error_limit 0.0000000000008//0.1//0.0000000000008//0.000000000000008//0.0001
#define efficiency 0.9//0.3//0.9//0.3//0.9
#define is_win  true
/*hiro:添加全局的字符-下标转换数组，真是的，该全局的不全局，，，写函数也好啊。。。*/
const string character = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";

/*hiro：写在前面，我真的想不懂为何一堆应该局部的变量写全局，，偷懒也不是这么偷的啊。。。
而且该全局可以偷懒的又不写，，*/
int i,j,k,l,m,n;
int inputMode[26][7][5];

/*hiro:↓↓修改了原本不友好的写法*/
double weight[OutputLayerRow][OutputLayerColumn][InputLayerNum];

/*hiro：记录迭代次数*/
int current_iteration_num=0;
/*hiro:当前学习效率*/
double study_efficiency=efficiency;

/*hiro:↓↓修改了原本不友好的写法*/
/*hiro：这个变量的名字应该和一些库文件里的声明冲突了，遂更改为my_distance*/
long double my_distance[OutputLayerRow][OutputLayerColumn];

/*hiro:保存了当前时刻的结点影响范围*/
int neighbor_width=OutputLayerColumn;
int neighbor_height=OutputLayerRow;

/*hiro:姑且是保存了所有获胜节点的下标，但是并没有用上
后面它又通过遍历的方法来获取获胜结点的下标。。*/
int row[OutputLayerRow], column[OutputLayerColumn];

/*hiro:改为bool 型更符合语意，保存了该下标是否为获胜节点*/
bool flag[OutputLayerRow][OutputLayerColumn];

int temp_row,temp_column;
int winner_row,winner_column;
long double min_distance=1000.0;


/****************************************************************/
//该函数初始化距离变量为0,初始化保存胜出节点的位置的变量
/****************************************************************/
void init_distance()
{
    for(i=0;i<OutputLayerRow;i++)
        for(j=0;j<OutputLayerColumn;j++)
            my_distance[i][j]=0.0;
 }

/*hiro:增加函数用于处理范围参数
for_weight字段用来判断在weight_change函数里需要额外进行的操作*/
void legalizeInput(int &ttLow, int & ttUp, int &ppLow,