【论文翻译】Clustering categorical data in projected spaces
Clustering categorical data in projected spaces
摘要
分类问题已经得到了广泛的研究,但是现有的方法还存在以下限制:
难以在高维空间测量低维度集群
缺乏识别每个集群相关维度的自动机制
缺乏异常值检测机制
依赖于一组需要适当调整的参数
我们努力提出一种用于高维分类数据的全自动投影聚类算法,它能够在单一框架中面对上述四个问题。方法包含两个阶段:
异常处理
投影空间的聚类
算法的第一阶段是基于概率的方法,利用beta混合模型以一种系统的方式从数据集中识别和消除
原创
2021-01-12 16:38:51 ·
209 阅读 ·
0 评论