C4.5是基于ID3改进的分类决策树算法,特点是C4.用信息增益率来选择属性,而ID3使用的是熵(entropy, 熵是一种不纯度度量准则),且对非离散数据也能处理,能够对不完整数据进行处理。 1、信息熵: 2、条件熵: