CMALE 开发过程管理

最新推荐文章于 2024-10-14 21:36:44 发布

闵帆

最新推荐文章于 2024-10-14 21:36:44 发布

阅读量189

点赞数

CC 4.0 BY-SA版权

分类专栏：开发笔记文章标签：线性代数

本文链接：https://blog.csdn.net/minfanphd/article/details/120403857

11 篇文章

订阅专栏

Cost-sensitive multi-label active learning 是我们正在进行的工作. 这里分析相关程序. 与项目无关现在不要看, 等我们把论文和代码弄好后, 配套看.

1. 工具类 SimpleTools.java

本类读入 arff 文件, 存储成一个数据矩阵和标签矩阵

如何进行代价敏感训练、分类？

本类的神经网络支持全连接层和并行连接层. 输入端口数为条件属性数, 输出端口数为标签数的 2 倍.

train: 训练一轮, 仅使用被查询过的对象
emphasizedTrain: 训练一轮, 被强调的数据多次训练, 支持增量学习. 这是因为主动学习过程是增量学习
test: 使用所有数据测试
computeLabelUncertaintyMatrix: 计算标签不确定性矩阵 注意: 这是核心方法, 以后可能要修改策略
getMostUncertainLabelIndices: 获得不确定性最高的几个标签, 包括对象下标 (一个) 与标签下标 (多个) 注意: 以后可能修改, 以支持多个对象的批量选取, 缩短程序运行时间
getUncertainLabelBatch: 大家好, 我就是上一条说的 “以后”
forward: 神经网络标准的前向操作
backPropagation: 神经网络标准的回馈操作

本类实现算法的主体, 很多地方都需要根据实验结果修改.

initializeMultiLabelAnn: 初始化分类器
boundedTrain: 给定训练轮数的下界、上界, 进行训练
boundedEmphasizedTrain: 给定训练轮数的上界, 进行针对性 (增量) 训练
computeInstanceRepresentativeness: 计算所有对象的代表性
twoStageLearn: 两阶段学习: 冷启动 (仅考虑对象代表性与标签稀少性) 与正常训练 (考虑标签不确定性) 注意: 这里是算法的核心, 需要改策略
randomSelectionLearn: 随机选择标签的学习, 作为对比算法. 如果我们的策略不比随机策略好, 就没有意义

未完待续