KNN算法易于理解,可以用在归类和回归两种方法上,并且不需要对数据有假设,优点是易于解释,在分类上用到的多,对异常值不敏感,可以去做量化预测信号。
该网站介绍了如何使用sklearn去做KNN模型预测,这个Youtube视频也简单介绍了如何python实现KNN预测:KNN Algorithm - Finding Nearest Neighbors (tutorialspoint.com)Scikit-Learn 8 cross validation 交叉验证1 (机器学习 sklearn 教学教程tutorial) - YouTube
常用的是交叉检验,对K从1到30去找平均score,画图x轴是K,y轴是score,去观察预测是否稳定,分数是否能够保持在较高水平,在量化里是个可以简单尝试的方向。