当子集较少时不必使用for循环即可实现。
步骤很简单:计算总的信息熵,计算标签信息熵,再计算信息增益。
1、创建data1
2、计算最后一列即跑步中二分类的占比
3、计算总的信息熵
4、以一个标签为例计算不同标签的gain值
(1)定义函数并以一个标签为例计算不同子集的信息熵
(2)计算不同子集所占的比例
(3)不同子集信息熵与所占比例之积求和
(4)该标签的信息熵
当子集较少时不必使用for循环即可实现。
步骤很简单:计算总的信息熵,计算标签信息熵,再计算信息增益。
1、创建data1
2、计算最后一列即跑步中二分类的占比
3、计算总的信息熵
4、以一个标签为例计算不同标签的gain值
(1)定义函数并以一个标签为例计算不同子集的信息熵
(2)计算不同子集所占的比例
(3)不同子集信息熵与所占比例之积求和
(4)该标签的信息熵