项目场景:
应用主动学习的多标签分类算法
代码总体结构:
主要分为两部分:传统ANN和ParallelAnn
传统ANN对每个实例的特征进行输入,经历几层后,开始实行
l
l
l个并行的ANN,每一个并行的part输出层都为两个节点,分别表示有还是没有这个标签。
代码分析:
FullConnectAnn类:说明了在ANN网络中输入节点数,有几个隐藏层,隐藏层节点数,以及最终输出节点数(即类别)。规定了epoch大小,定义了train,forward,backPropagation;这个类就是实现了普通的全连接。
FullConnectAnnLayer类:说明了在整个ANN网络中某一层怎么工作的,FullConnectAnnLayer方法说明了一次的输入与输出等信息,构建该层的权重矩阵,weights矩阵。forward方法,将每个节点与weight矩阵对应的值相乘得到新的值进行激活可以得到下一个节点的值。getLastLayerErrors方法通过激活后的输出与本来标签对比得到每个节点的误差值。
backPropagation方法,通过getLastLayerErrors方法得到的值进行输入,然后更新权重。
Activator类主要包括activate和derive方法。作用是在每一层计算下一层时用于激活,从线性变换到非线性变换。derive是反馈机制,从后往前根据每个节点的预测误差更新权重。
GeneralAnnLayer类:存放了一些都要用的方法,后面写两个不同的ANN时,继承就可以不用再来写一遍。
ParallelAnnLayer类:将每一层的传递,变成每个part的每一层传递,其余与之前FullAnn一致。(这里
i
j
k
ijk
ijk的关系分别对应什么要理解清楚,不然代码容易出现混乱)
for (int i = 0; i < numParts; i++) {
for (int j = 0; j < numInputEachPart + 1; j++) {
for (int k = 0; k < numOutputEachPart; k++) {
⋯
\cdots
⋯}
}
}
i表示第几个parts,j表示每个parts中第几个输入节点,k表示parts中第几个输出节点。
MultiLabelAnn类:把FullConnectAnn和ParallelAnn整合,放在一起实现多标签上的应用。