一. 论文任务分配
- 摘要(MXY)
进展情况(完成了80%,需要根据实验结果进行修改) - 引言
2.1 文献综述(QK)
进展情况(完成了20%,需要和参考文献一起写)
2.2 本文工作的描述(MXY)
进展情况(完成了50%,需要根据实验结果进行修改) - 基础知识
3.1 基本问题(MXY)
多标签学习、主动学习、代价敏感学习
3.2 已有组合(QK)
多标签主动学习、代价敏感主动学习、代价敏感多标签学习
3.3 问题描述(完成了80%) - 本文技术
4.1 预测模型(QK)
(完成了60%,可能根据根据实验结果进行修改)
4.2 实例-标签对选择
4.2.1 实例代表性(完成了80%)(MF)
4.2.2 标签不确定性(完成了80%)(MF)
4.2.3 标签稀有性(完成了80%)(MF)
4.2.4 正负标签比例与误分类代价(完成了60%)(MF)
4.3 代价控制的结束条件
4.3.1 标签近期价值(完成了50%)(MXY)
4.3.2 标签远期价值(完成了20%)(MXY)
4.4 算法描述(完成了50%)(MXY) - 实验
QK 负责实现已有算法并实验,MXY 负责 CMALE 的实验
5.1 数据集(完成了60%,需要根据实验结果进行选择)(QK)
5.2 与多标签学习算法的比较(完成了0%,需要实现已有的算法,且进行大量实验)
说明预测模型的有效性,在同样的标签的数据集上,精度更高
5.2 与多标签主动学习算法的比较(完成了0%,需要实现已有的算法,且进行大量实验)
说明标签选择方案的有效性,标签数量相同时,精度更高
5.3 与代价敏感多标签主动学习算法的比较(完成了0%,需要实现已有的算法,且进行大量实验)
说明对代价的适应性,能获得更小的总代价 - 结论及进一步工作(完成了10%,难度不大)(MF)
- 参考文献(完成了20%,繁琐)(PY)
二. 代码任务分配 (MXY)
- 数据管理类 multi_label_data.py
1.1 数据读入(完成)
1.2 查询标签支持(完成)
1.3 精度计算(完成)
1.4 代价计算(未完成) - 神经网络类 multi_label_ann.py
2.1 全连接 + 并行网络(完成)
2.2 CNN + 并行网络(未完成,暂时不需要) - 主要算法类 cmale.py
3.1 冷启动
3.1.1 实例代表性(完成)
3.1.2 标签稀有性(完成)
3.1.3 查询方案(完成了50%,对于每个代表性样本只查询了1个标签,不知道是否需要调整方案,代表性强的样本查询更多标签)
3.1.4 正负标签比例统计(未完成)
3.2 正常学习过程
3.2.1 标签不确定性(完成80%)
3.2.2 标签比例控制(完成20%,应根据正负标签比例和代价计算)
3.2.3 标签近期价值(未完成)
3.2.4 标签远期价值(未完成)
3.2.5 查询方案(完成了40%)
3.2.6 增量训练(未完成)
三. 可能的难点
- 大数据集的处理
可能非常耗时,需要调整网络结构. - 图像数据的处理
可能需要将全连接部分替换为 CNN. - 比较算法
多标签的容易找,但多标签主动学习的相对难找,代价敏感的可能没有.