cs231n–p5图像分类-k最邻近算法
K-Nearest Neignbors:Distance Metric
L1的距离取决于你选择的坐标系统,如果你转动坐标轴将会改变点之间的L1距离,而改变坐标轴对L2的距离毫无影响
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nZDQ4X8D-1655912633415)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622212347455.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KNfzbmaw-1655912633416)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622212525806.png)]
超参数:像K和距离度量这样的选择
question1、
在什么情况下L1距离要比L2距离表现的好:
回答:这主要和要解决的问题相关,它很难说在哪种情况下一个比另一个更好,但是我认为因为L1有这种坐标依赖,它实际上依赖于数据的坐标系统,如果你知道你有一个向量,向量的各个元素,可能有意义,比如你也许处于某种原因要对员工进行分类向量的不同元素对应着员工的不同特征,这种情况下L1表现的更好
吧数据分为三组,训练集,验证集,测试集
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fsHPgrWX-1655912633416)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622213736985.png)]
交叉验证:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XuE9NECD-1655912633417)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622213944175.png)]
交叉验证的结果
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V4gVnbCq-1655912633417)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622214345771.png)]
这两组图片的L2距离相同(构造出来的)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SKATJWgB-1655912633417)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622214639561.png)]
维度灾难:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-g6mUiMtI-1655912633418)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622214736162.png)]
小结:
KNN介绍了图像分类的基本思路借助训练集的图片和相应的标记我们可以预测测试集中数据的分类
knn作业:
本思路借助训练集的图片和相应的标记我们可以预测测试集中数据的分类
knn作业:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QAQqqOP5-1655912633418)(C:\Users\86187\AppData\Roaming\Typora\typora-user-images\image-20220622215127637.png)]