1.ID3算法只考虑信息增益(information gain),而对于特征中有类似编号这种唯一标识性的特征的数据来说,ID3算法会把这一特征设为最优划分属性,因为根据这一属性就能让每个分支包含的样本最少而且都是同类的,这样导致决策树不具有泛化能力。