决策树分类算法的关键点在于:
哪一个特征量起关键作用,即根据哪一个特征量对数据进行划分。则需要根据每一个特征量分别对数据进行划分。分别求出划分后的数据的信息增益,信息增益最大的对应的特征量即为所选择的特征量。
其中,信息增益=原数据的信息熵-划分后数据的信息熵
信息熵=
决策树分类算法的关键点在于:
哪一个特征量起关键作用,即根据哪一个特征量对数据进行划分。则需要根据每一个特征量分别对数据进行划分。分别求出划分后的数据的信息增益,信息增益最大的对应的特征量即为所选择的特征量。
其中,信息增益=原数据的信息熵-划分后数据的信息熵
信息熵=