- 博客(2)
- 收藏
- 关注
原创 KD树的python实践
简单的KNN算法在为每个数据点预测类别时都需要遍历整个训练数据集来求解距离,这样的做法在训练数据集特别大的时候并不高效,一种改进的方法就是使用kd树来存储训练数据集,这样可以使KNN分类器更高效。 KD树的主要思想跟二叉树类似,我们先来回忆一下二叉树的结构,二叉树中每个节点可以看成是一个数,当前节点总是比左子树中每个节点大,比右子树中每个节点小。而KD树中每个节点是一个向量(也可能是多个向量),和
2016-03-23 20:04:34 3204 3
原创 KNN 实践笔记
终于下定决心要开始写博客了,博客的第一个系列是机器学习算法的python实践,主要是我对一些机器学习算法的学习笔记和实践记录,在每篇文章的最后,还会给出scikit-learn包中对应实现的使用指南。 KNN算法是一个简单的分类算法,它的动机特别简单:与一个样本点距离近的其他样本点绝大部分属于什么类别,这个样本就属于什么类别,算法的主要步骤如下: 计算新样本点与已知类别数据集中样本点的距离。
2016-03-22 12:24:41 521
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人