一、机器学习概率
机器学习的算法有很多,这里从两个方面进行介绍:一个是学习方式,另一个是算法类似性。1.学习方式
根据数据类型的不同,对一个问题的建模可以有不同的方式
1)监督学习:
在监督学习下,输入数据被称为“训练数据”,每组训练数据都有一个明确的标识或结果,如对防垃圾邮件系统中的“垃圾邮件”、“非垃圾邮件”,对手写数字识别中
的“1”、“2”、“3”、“4”等。在建立预测模型的时候,监督学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断地调整预测模型,直到模型的预测结果达到一个预期的准确率。监督学习的常用应用场景包括分类问题和回归问题。常用算法有逻辑回归和反向传递神经网络。
2)非监督学习:在非监督学习下,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习及聚类等。常用算法包括Apriori算法和K-means算法。
3)半监督学习:
在半监督学习下,输入数据部分被标识,部分没有被标识。这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构,以便合理地组织数据进行预测。其应用场
景包括分类和回归。常用算法包括一些对常用监督学习算法的延伸。这些算法首先试图对未标识的数据进行建模,然后在此基础上对标识的数据进行预测,如图论推理算法或拉
普拉斯支持向量机等。
4)强化学习:在强化学习下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅作为一种检测模型对错的方式。在强化学习下,输入数据直接反馈到模型,模型