主动学习假设:
1、在未标注数据中搜索的时间明显要少于标注数据的时间。链接:Performance Thresholding in Practical Text Classification:
主动学习挑战:
抽样偏差:必须找到代表性的空间:能够考虑小而有偏差的sample in AL
miss cluster
信息量比较大
比较有代表性
主动学习假设:
1、在未标注数据中搜索的时间明显要少于标注数据的时间。链接:Performance Thresholding in Practical Text Classification:
主动学习挑战:
抽样偏差:必须找到代表性的空间:能够考虑小而有偏差的sample in AL
miss cluster
信息量比较大
比较有代表性