- 博客(4)
- 收藏
- 关注
原创 西瓜书chapter4简摘
D~:表示具有完整参数的样本集,D为样本集,K代表样本的种类数目,V代表某一属性的K种取值。样本初始权重Wx均为1. 1.首先计算D~~的信息熵 ~~5.计算所有属性在D上的信息增益,选择最大的作为根节点进行划分。而如果将边界变为斜线,则对应的非叶节点则不再代表单一属性,而是多个属性的线性组合,提高了效率也减少了计算量。对于决策树划分的边界而言,若将所有属性看做一条坐标轴,其划分的边界均平行于坐标轴。~~ 2.其次计算某属性各取值的信息熵 ~~~~ 3.获得D~~上该属性的信息增益。
2022-11-24 11:25:13
262
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人