cs221n学习笔记
sift feature:基于特征的目标识别,在该目标上确认某些关键特征,然后把这些特征与相似目标进行匹配。
金字塔匹配:从图片的不同部分提取特征放在一起,在此基础上做SVM。
hog特征(方向梯度直方图):计算和统计图像局部区域的梯度方向直方图构成特征,适合做人体检测
K-最近邻算法(KNN)
距离度量: L1距离和L2距离
改变坐标轴对L1距离有影响,对L2距离无影响,当输入向量是特征向量,向量某些元素有特殊或重要实际意义,通常用L1距离度量更合适;当向量为一般向量,不确定其中某些元素的值,L2距离更为合适.
对于KNN算法,使用L1距离度量,决策边界趋向于跟随坐标轴,依赖数据的坐标系统,而L2不会.
KNN算法步骤:
- 1)计算测试数据与各个训练数据之间的距离;
- 2)按照距离的递增关系进行排序;
- 3)选取距离最小的K个点;
- 4)确定前K个点所在类别的出现频率;
- 5)返回前K个点中出现频率最高的类别作为测试数据的预测分类
超参数设置:
方法一:将数据集分为三组,大部分数据作为训练集,剩下部分分为测试