B站:啥都会一点的研究生
公众号试读:啥都会一点的研究生
目录
说说KNN是什么?
KNN(K Nearest Neighbors),即K个最近的邻居。KNN的原理是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个类别。通过方差表示“距离”。
说说KNN有哪些要素?
有三要素:
1.k值的选取
2.距离度量的方式。 一般为欧式距离
3.分类决策规则。 分类一般为多数表决,就是哪类多选哪类。回归为选择平均法,即k个样本输出的平均值作为预测输出。
说说KNN的K值怎么选?
通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的K值开始,不断增加K的值,然后计算验证集合的方差,最终找