- 曼哈顿距离(Manhattan distance):L1距离
- 欧几里得距离(Euclidean distance):L2距离
为什么KNN在图片分类上基本不用?
1. KNN在运用时需要大量时间,效率很低。(一般我们允许在训练时花费大量时间,而要求在使用时反应很快)
2. 图像物体在平移、光线亮度、部分像素点缺失等等情况下,其预测的结果应该保持不变。但基于对应像素点的KNN算法在这些情况下表现出明显的不适应性。
数据集一般分为3个部分(足够大时):训练集、验证集、测试集。
- 训练集:用于训练模型
- 验证集:用于选择模型和超参数
- 测试集:用于验证泛化能力
视频中为图像添加描述文字的系统由两部分组成:
- CNN: 用于计算机视觉(察觉图片)
- RNN:用于排序问题(如组织语言)
线性分类器和神经网络相比,它不具备同时获取所有模型的能力(比如说红色的保时捷和蓝色的兰博基尼),它只会综合样本得出一个较为平均的判断条件。图片位置、角度、颜色等都对线性分类器进行图片分类造成困扰。
神经网络为什么能解决线性分类器不能解决的问题?
最简单的神经网络又名多层感知机,实际是多层逻辑回归。神经网络含有多层隐藏结构,其每次逻辑回归大概相当于划分一条边界,一层隐藏层相当于一个折线超平面,由多层隐藏层组成的神经网络就相当于一个超曲面。