对于监督学习,已经被告知了什么是所谓的正确答案
无监督学习,都具有相同标签或都没有标签,我们得到一个数据集不知道拿它做什么,也就是说,有个数据集,我们需要从中找到某种结构
无监督学习中,最常见的是聚类算法,寻找数据集的规律,将数据分成几个簇
举例
①谷歌新闻就是用的聚类算法,收集新闻,聚类分成新闻专题
②基因组的应用,DNA微矩阵数据,给定一组不同的个体,对于每个个体检测他们是否拥有某个特定基因是,也就是要检测特定基因的表达程度,不同颜色展示不同个体拥有特定基因的程度,然后可以使用聚类算法,把不同个体归入不同类或不同类型的人,这就是无监督学习
③大型集群,识别集群中适合协同工作的机器
④社交网络的分析,社交圈的聚类,判断哪些人互相认识
⑤市场划分,根据客户信息自动找出不同的市场分割
⑥天文数据聚类,星系形成理论
鸡尾酒会算法,一个有趣的算法,分离出鸡尾酒会中同时说话的每个人的独立信号,并不是一个常用的无监督学习算法