- 博客(9)
- 收藏
- 关注
原创 4/13作业
系统越混乱或者分散,熵值越高。决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,(2)准确性高:挖掘出的分类规则准确性高,便于理解,决策树可以清晰的显示哪些字段比较重要。(2)为了处理大数据集或连续值的种种改进算法(离散化、取样)不仅增加了分类算法的额外开销,而且降低了分类的准确性,对连续性的字段比较难预测,当类别太多时,错误可能就会增加的比较快,当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。Ent(D)的值越小,则D的纯度越高。
2023-04-13 19:17:42 63
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人