图像分类之K最邻近法厕所级讲解
思想:人以群分,身边大多数人是啥样的你就是啥人,hhh。
流程(假设来将你分类):
- 计算你身边所有人与你的关系紧密程度。比如你老婆距离3,亲人距离5,朋友距离8。
- 圈定你觉得多大的圈子能衡量你这人是啥人,跟你关系不咋地的人不能作为评价你的依据。(你得从你圈子里找出k个人)
- 根据你选的圈子里的这K个人,计算占比最高的那一类人作为你的标签。(比如:设定你选了k=5个人作为你的关系圈,你选的圈子里有四个善良人,有一个恶人,那就判定为善良人。)
评价细则(一种方式定义你的善恶不理想性,让你用多种方法评价)
距离度量(计算关系紧密程度)
- 曼哈顿距离
- 欧式距离
影响参数
- K (超参数调优)
- 距离度量
不足
- 假设大环境下社会安定大家大多都是善人,可能由于大环境原因你是漏网之鱼。(受大容量类样本影响)
由于大环境原因你是漏网之鱼。(受大容量类样本影响)- 搞清楚所有跟你有关系的人的关系程度需要很大的“计算量”(计算量大)