【常用算法体系】
机器学习的方法是基于数据产生的"模型"(model)的算法,也称"学习算法"(learning
algorithm)。包括有监督学习(supervised learning)、无监督学习(unsupervised learning)、
半监督学习(semi-supervised learning)、强化学习(reinforcement learning)。
【有监督学习】
指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程;只要模型被确定,就可以应用到新的未知数据上。这类学习过程可以进一步分为「分类」(classification)任务和「回归」(regression)任务。在分类任务中,标签都是离散值;而在回归任务中,标签都是连续值。
【无监督学习】
指对不带任何标签的数据特征进行建模,通常被看成是一种 “让数据自己介绍自己” 的过程。这类模型包括「聚类」(clustering)任务和「降维」(dimensionality reduction)任务。聚类算法可以讲数据分成不同的组别,而降维算法追求用更简洁的方式表现数据。
【半监督学习】
介于有监督学习和无监督学习之间。通常可以在数据不完整时使用。
【强化学习】
强化学习不同于监督学习,它将学习看作是试探评价过程,以"试错"的方式进行学习,并与环境进行交互已获得奖惩指导行为,以其作为评价。此时系统靠自身的状态和动作进行学习,从而改进行动方案以适应环境。
k-NN算法(k-Nearest N