
数据挖掘知识点复习
EM聚类通过迭代过程来估计数据的隐变量(即簇的成员资格)和模型参数(即簇的中心和协方差),直到收敛。这些模式可以是分类(将数据分为不同的类别)、聚类(将数据分组,使得同一组内的数据相似度高,不同组之间的数据相似度低)、关联规则学习(发现变量之间的有趣关系)、异常检测(识别数据中的异常或离群点)等。1. **数据预处理**:这是数据挖掘的第一步,包括数据清洗(去除错误和不一致的数据)、数据集成(合并来自不同来源的数据)、数据选择(选择与分析任务相关的数据子集)以及数据变换(将数据转换成适合挖掘的形式)。



















