一、半监督学习 (一)无标签数据的假设 相似特征同label同一类同label流行假设:数据的复杂度往往比呈现出的小得多,因此可以做降维处理 (二)怎样处理无标签数据? 1、self-training self-training是一种典型的半监督学习算法 先训练,再预测,再融合。关键在于保证高置信度,可以用到复杂的模型。 2、Active Learning+Self-training