题记:对于大多数医生来讲,理解前面两篇机器学习的内容可能有难度,学习重在于积累,“不积跬步,无以至千里”。笔者本人也是从一句R语言代码也读不懂的菜鸟一步一步走过来。坚持学习,总会有收获。今天这篇读书笔记我们将介绍两种非线性分类技术:K最近邻法(KNN)与支持向量机法(SVM)的原理。本文参考Cory Lesmeister博士主编《Mastering Machine Learning with R》(第2版)。有部分改动。
本文是个人的读书笔记,仅限于学习交流使用,勿做他用。我只是一个知识的搬运工。如有侵权,请联系本号,本号将尽快删除。
1. 背景知识
K最近邻法(KNN)与支持向量机法(SVM)这两种技术放弃了线性假设,理解起来要比我们之前讨论的那些技术复杂。但这样不一定能保证得到更好的预测结果,而且向非专业人士解释模型也会有一点问题,计算效率也低。正确使用这些技术时,可以作为其他分类技术和工具的补充。除了能够解决分类问题之外,它们还可以用于预测连续型的结果。
2. K最近邻法
在之前的工作中,我们建立的模型具有系数。换句话说,要对模型包含的特征进行参数估计。本章KNN中没有参数,因为这种学习方法是所谓的“基于实例的学习”。简言之,保存被标记过的“实例”学习其输入和相应的输出标记,直至一个新的输入模式请求一个输出值(Battiti和Brunato,2014,p.11)。这种方法通常称为懒惰学习,因为不产生具体的模型参数。用于训练的实例本身就是知识。要预测任