对于一个分类,判断它本身是否“纯净”,可以用熵、基尼不纯度遇到两个分布的距离,可以用KL判断两个量的相关性,比如某个特征与某个类别是否有关系,可以用互信息(其实它与条件熵,差不多) 基本内容:http://www.cnblogs.com/TtTiCk/archive/2008/06/25/1229480.html连续型的时候:http://blog.csdn.net/daringpig/article/details/8556135