1.主动学习(active learning)
获取的大量数据为未标注数据,无法直接使用,人工标注消耗大。
主动学习先对这些数据进行筛选,将筛选出的数据提供给专家进行标注。
模型A=(C,L,S,Q,U)
C为一个或一组分类器,L为已标注数据集,Q为查询函数,以某种标准在未标注数据中查准信息量大的数据,U为未标注样本集,S为督导者,可对样本进行标注。
步骤:(1)随机从未标注样本集U中选取小部分数据,由S进行标注,作为初始样本集建立模型
(2)S从未标注样本集U中以某种标准Q选取一定未标注样本进行标注,并添加到L中,重新训练分类器,直到达到停止标准为止。