Python深度学习实践:半监督学习减少数据标注成本 作者:禅与计算机程序设计艺术 1. 背景介绍 1.1 深度学习的数据标注瓶颈 1.1.1 深度学习对大规模标注数据的需求 1.1.2 人工标注数据的高昂成本 1.1.3 数据标注成为深度学习应用的瓶颈 1.2 半监督学习的优势 1.2.1 利用未标注数据降低标注成本 1.2.2 提高模型泛化能力 1.2.3 适用于标注数据稀缺的场景 2. 核心概念与联系 2.1 监督学习、无监督学习与半监督学习 2.1.1 监督学习:利用标注数据训练模型 2.1.2 无监督学习:利用未标注数据挖掘数据结构 2.1.3 半监督学习:同时利用标注与未标注数据 2.2 半监督学习的分类 2.2.1 自训练(Self-Training)