1.机器学习
严格定义由Tom Mitchell于1998年提出:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
2.监督学习(supervised learning)
监督学习的数据集是带有标签(属性)的一堆数据,根据数据是离散的还是连续的又可分为回归问题和分类问题。
2.1回归问题(regression problem)
例如,已知北京一个楼盘近些年的房价,预测未来几年的房价。在这个数据集里,每个数据有房价和面积两个标签(属性)。由数据集里的数据我们可以画出二维坐标图,得到预测函数,然后就可以预测不在数据集里的数据(即不同面积的房价)
2.2分类问题(classification problem)
例如,预测肿瘤是良性还是恶性。在数据集里,每个数据有尺寸和(良性或恶性)两种标签。由数据集,我们可以画出二维坐标图,之后我们可以预测不同大小的肿瘤应该是良性还是恶性
3.无监督学习(unsupervised learning)
无监督学习的数据集是由一堆没有标签(属性)的数据组成。如下图:
由样本集里的数据的特征自动聚合(cluster)得到结果。