类比较挖掘
挖掘类比较:区分不同的类
类比较挖掘的目标是得到将目标类与对比类相区分的描述
目标类和对比类间必须具有可比性,即两者间要有相似的属性或维
很多应用于概念描述的技巧可以应用于类比较,比如属性概化
属性概化必须在所有比较类上同步进行,将属性概化到统一抽象层后进行比较
类比较的过程
数据收集
通过查询处理收集数据库中相关数据,并将其划分为一个目标类和一个或多个对比类。
维相关分析
使用属性相关分析方法,使我们的任务中仅包含强相关的维
同步概化
同步的在目标类和对比类上进行概化,得到主目标类/方体和主对比类关系/方体
导出比较的表示
用可视化技术表达类比较描述,通常会包含“对比”
度量,反映目标类与对比类间的比价(e.g count%)
类比较描述的判别规则表示
类比较描述的目标类和对比类的区分特征也可以用量化规则来表示,即量化区分规则
量化区分规则使用D-weight作为兴趣度度量