无监督学习(unsupervised learning)是机器学习的一种方法,没有给定事先标记过的训练示例,自动对输入的数据进行分类或分群。
- 即从无标签的数据开始学习的。
两种无监督学习任务
- 将数据按相似度聚类(clustering), 成为不同的分组;
- 降维(reducing dimensionality),以便在保留数据结构和有用性的同时对数据进行压缩。
无监督学习方法可能有用的案例:
- 一家广告平台需要根据相似的人口学特征和购买习惯将美国人口分成不同的小组,以便广告客户可以通过有关联的广告接触到他们的目标客户。
- Airbnb 需要将自己的房屋清单分组成不同的社区,以便用户能更轻松地查阅这些清单。
- 一个数据科学团队需要降低一个大型数据集的维度的数量,以便简化建模和降低文件大小。