二叉树各种遍历
https://blog.csdn.net/Candy_GL/article/details/88531064
后续遍历
https://blog.csdn.net/u012435142/article/details/89062177
kmeans适用条件
数据集是凸数据集,就是数据集内任意两点的连线上所有的点都在数据集内,否则分类效果就很差,
K means没有严格的前提要求,但是如果数据不符合下面三个要求的话,K means得到的结果可能会比较奇怪:
1. 数据中每个变量的方差基本上要一样
2. 每一个cluster中每个变量都是近似正态分布(或者众数等于中位数的对称分布)
3. 每一个cluster中的元素个数要几乎一样
条件1和2就几乎保证了每个cluster看起来像是球形(而不是椭球形),而且是图的。
为什么条件3也很重要呢,可以看下面这个例子,尽管我们肉眼能看出三个稀疏程度不同的球状簇,但是K means却分成了三个样本数量相似的三个簇