Unsupervised Learning原理与代码实例讲解
作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming
1. 背景介绍
1.1 问题的由来
在人工智能领域,监督学习(Supervised Learning)和半监督学习(Semi-supervised Learning)一直占据着主导地位。然而,在实际应用中,我们常常会遇到以下问题:
- 标注数据稀缺:在某些领域,例如医学影像、语音识别等,获取大量标注数据非常困难,甚至不可能。
- 标注成本高昂:标注数据需要人工完成,过程繁琐且成本高昂,限制了模型训练的规模和速度。
- 数据分布不均:在实际应用中,数据往往存在分布不均的情况,导致模型性能下降。
为了解决这些问题,无监督学习(Unsupervised Learning)应运而生。无监督学习通过学习数据分布,寻找数据中的隐藏模式,从而实现信息提取、聚类、降维等任务。无监督学习在数据挖掘