分类/回归:+标签
分类(Classification),即找一个函数判断输入数据所属的类别,可以是二分类问题(是/不是),也可以是多类别问题(在多个类别中判断输入数据具体属于哪一个类别)。与回归问题(regression)相比,分类问题的输出不再是连续值,而是离散值,用来指定其属于哪个类别。
回归(Regression),是一种统计方法,于对具有一个或多个自变量的因变量(目标变量)和自变量(预测变量)之间的关系进行建模
聚类:无标签
聚类(Clustering)是最常见的无监督学习算法,它指的是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。
NFL定理:脱离具体问题讨论“什么是最好的算法”是无意义的;
在某些问题上表现良好的学习算法,在另一些问题上也有可能表现得不尽人意,因此还是必须关注算法与具体问题的匹配程度怎么样