1、基本概念
机器学习是一种能够赋予机器学习的能力并以此让它完成直接编程无法完成的功能的方法。但从知己上来说,机器学医是利用数据,训练处模型,然后使用模型预测的一种方法。
2、机器学习的基本分类:
1、监督学习:每组训练数据有一个明确的标识或结果,在建立预测模型的时候,监督式学习建立的学习过程,首先将预测结果与“训练数据”的实际结果进行比较,然后再不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)
2、无监督学习:数据并不被特别的标识,学习模型只是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。
3、半监督学习:有一部分数据是被标识的,有一部分数据是不被标识的,模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM.)等。
4、强化学习:输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning)