Whatis machine learning:
ArthurSamuel (1959): Field of study that gives computers the ability to learn withoutbeing explicitly programmed.(无需明确的编程即可让机器自己去学习)
SupervisedLearning:(监督学习)
在监督学习中,我们已经知道正确的输出应该是什么样的,同时知道输入和输出的结果必然会有某种联系。
监督学习可分为regression(回归分析)和classification(分类分析)问题。
1. Regression:
此类问题我们要尝试根据continuous output去预测结果(results),也就是尝试去map input variables to some continuous function(如根据一年以来的房价来预测下个月的房价是多少)
2. Classification
此类问题我们我们无法获得连续性的预测模型,而是用输出值去匹配离散的区块。(如预测肿瘤是良性还是恶性、预测房价是高于平均值还是低于平均值)
UnsupervisedLearning(非监督学习)
非监督学习下我们往往对训练结果无法预知或是知之甚少,此时往往我们更注重获得数据的structure,此种structure基于变量和数据的关系。根据预测结果,非监督学习下通常并没有feedback。(例如鸡尾酒会效应(cocktail party)中的语音分辨和选择、根据基因之间的关系自动为基因序列分组)