监督学习:根据已有的数据集,我们知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。监督学习主要分为分类问题和回归问题。
分类问题:输出结果是有限个结果,比如结果集为T={A,B,C}。
回归问题:更像是一个连续的函数y=f(x),根据你的输入x,得到一个y值。
生活中的例子来说明:分类问题,比如给你一些植物的特征,比如颜色,味道,大小,让你来判断它是属于蔬菜,还是水果等。这个结果是有限的。回归问题:给你今天某只股票的资金流入流出量,市盈率等,让你预测明天涨跌多少,这里这个值就是不确定的,是根据你的输入得到的一个值,他们之间类似于一种函数关系。
无监督学习:相对于监督学习,即我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。
无监督学习的代表:聚类分析,假如给你一堆语音数据,你并不知道这些数据之间的关系,有什么样的联系,经过聚类分析后,可能会给你这样的结果,这个模型给你将数据分为了两类,一类是人的声音、一类是乐器的声音。