- 按昨天晚上讨论的方案
1.1 使用训练、测试集分开,Open world 场景
1.2 使用交叉验证 5CV - 相应的程序调整
2.1 数据集读取及 5CV 划分应在 cmale.py 里面实现
2.2 multi_label_data 中 MultiLabelData.class 的初始化,参数不能给文件名,而是四个 np.array 类型数组。它们分别对应于训练集的条件属性、标签;测试集的条件、标签。 - 其它考虑
3.1 由于 5CV 在 MultiLabelData 之外,MultiLabelData 类用于 training-testing 场景也很方便。
3.2 需要根据几次的结果获得均值与方差。
3.3 对于主动学习而言,Open world 的结果可能比 Close world 的要差点。后者可能把一些困难的样本查询了。
3.4 相对于基于聚类的主动学习而言,建立分类器的主动学习可以同时适应 Open 和 Close world.
CMALE 基本实验方案 (20211020)
最新推荐文章于 2024-05-20 11:26:19 发布