Kmeans和Dbscan 都属于无监督学习范畴,在可视化条件下处理多维数据的方法一般是牺牲数据特点的降维算法,这极大地增加了数据分类的不精准性,若直接采用多维数据,又无法在matplotlib(一般是xy坐标系的二维显示)里很好的显示,同时,因为是无监督学习,所以又没有返回值,聚类可以分类,但是分类后的簇如何解释?(下面的表述可能会有异议,因为还没有足够的时间理清思路,但是却是研究方向)都是簇,而且肯定是特征不同的簇,如果相同就没有那么多簇了,这些簇因为是之前是多维数据并可能做了归一化处理,并参与了聚类计算,一旦做了归一化处理前后数据就会改变,可以做归一化逆运算,但是较繁琐,属于重复劳动。
聚类算法,无非是一个公式的包装,这个公式就是欧式距离,或者三角函数公式,所以,我们只要按照原理来操作,也可以很好的模拟出聚类算法,甚至在某些场合会比包装好的聚类算法要简单的多,更高效、快捷。
时间关系,下一篇更新源码和具体实例,未完待续…
聚类算法kmeans、dbscan在可视化matplotlib难以实现多维数据处理时的数据处理替代方法(一)
最新推荐文章于 2024-05-20 20:08:58 发布