无监督学习与监督学习的差别 一般公司都是招聘数据标注员人工标注 为什么要学无监督学习? 第一类:基于概率密度函数估计的方法 非监督参数估计 我们有一个没有标标签的数据集 许多PDF构成这个模型 我们对这个模型使用最大似然数估计试试看 涉及混合高斯分布,我们使用EM算法(不要慌)我在下面写了中文 这种情况,主轴方向不变,参数只与中心变量µ 有关 妈耶!英文看起来太累,试一试中文的解释 西电EM算法课程 最终结果我写出来在这里: 欧氏距离: 马氏距离 有了两个距离我们使用K均值聚类算法 K-Mean聚类详解:重庆大学课件