K近邻是最基础的一种分类和回归算法。通过本次课学习,理解其分类和回归原理,认识几种范数距离的意义,理解经验误差和泛化误差的意义,掌握交叉验证策略,并通过实验认识K值选择对算法误差的影响。算法通过暴力搜索近邻的效率较低,kd-tree和ball-tree通过二分查找提高对近邻点的搜索效率,学有余力的同学在理解算法的基础上,尝试读懂代码,并进行算法效率的比较,撰写研究报告。
K近邻是最基础的一种分类和回归算法。通过本次课学习,理解其分类和回归原理,认识几种范数距离的意义,理解经验误差和泛化误差的意义,掌握交叉验证策略,并通过实验认识K值选择对算法误差的影响。算法通过暴力搜索近邻的效率较低,kd-tree和ball-tree通过二分查找提高对近邻点的搜索效率,学有余力的同学在理解算法的基础上,尝试读懂代码,并进行算法效率的比较,撰写研究报告。