机器学习的定义:1,在没有明确定义的情况下,使计算机具有学习能力的研究领域。
2,计算机程序从经验E中学习解决某一任务T,进行某一性能度量P,通过P测定在T上的表现,因经验E而提高。
两个不同的人根据自己的理解提出的解释。
机器学习:
1,有监督学习:我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是求出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价。
回归问题:结果是线性的(我们设法预测出一个连续值的结果)
分类问题:结果是离散的(我们设法预测出一个离散值的结果)比如肿瘤良性还是恶性只有0或者1.两种结果。
2,无监督学习:相对于监督学习(给定输入,输出,作为参考),无监督学习不知道输入/输出是什么,只能将数据进行聚类。
聚类和分类的区别:
分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分类。