输入:训练数据集D和特征A 输出:特征A对训练数据集D的信息增益g(D,A) 1.计算数据集D的经验熵H(D) 2.计算特征A对数据集D的经验条件熵H(D|A) 3.计算信息增益 g(D,A)=H(D)-H(D|A)