机器学习-西瓜书(笔记一)—绪论
思维导图
基本术语
在机器学习中常见的基本术语包含:数据集、属性值、属性空间、特征向量、训练集、测试集等等,各自的英文表示在思维导图中有提及。
假设空间
假设空间主要提及了两种方法:归纳法和演绎法。归纳法是从特殊到一般的“泛化”;演绎法是从一般到特殊的“特化”
归纳偏好
归纳偏好指的是总误差是与学习算法无关的,任意两种算法的误差都相等。说到这里可能会觉得为什么会有模型选择和调参的步骤呢?上面的总误差是建立在问题的重要性是相同的,没有区分度,没有权重大小的区别。但在现实的问题中每个问题都有自己的重心,比如当我们需要计算A地点到B地点的距离时,如果距离遥远我们可能会选择坐飞机或者火车,当距离只有几公里时我们会选择自行车出行,当只有几百米时我们会选择步行为最佳到达方法。
同理,只有在具体的问题面前才会有最好的算法可言,脱离了具体的问题,任何算法都毫无意义,这就是归纳偏好性。
应用现状
自动驾驶、数据挖掘、天气预测、环境检测、智慧医疗、智慧交通等等