#Python3入门机器学习之10.决策树
_凡一
这个作者很懒,什么都没留下…
展开
-
Python3入门机器学习之10.3CART与决策树中的超参数
Python3入门机器学习10.3 CART与决策树中的超参数1.什么是CART?CART的全称为Classification And Regression Tree,是根据某一个维度d和某一阈值v进行二分。scikit-learn的决策树实现:CART。2.决策树中的超参数:...原创 2020-07-20 20:36:28 · 340 阅读 · 0 评论 -
Python3入门机器学习之10.2基尼系数
Python3入门机器学习10.2 基尼系数1.基尼系数:由以上例子可以看出:基尼系数越高意味着数据整体随机性越强,也就是不确定性越强;而基尼系数越低,意味着数据整体确定性越强。可以看出,基尼系数和信息熵一样,可以作为数据不确定性的度量。2.信息熵 vs 基尼系数:...原创 2020-07-20 20:06:43 · 1611 阅读 · 0 评论 -
Python3入门机器学习之10.1决策树和信息熵
Python3入门机器学习之10.1 决策树1.什么是决策树?通过以上的例子,我们会提出如何构造决策树的问题:①.每个节点在哪个维度做划分?②.某个维度在哪个值上做划分?2.信息熵:熵在信息论中代表随机变量不确定度的度量。熵越大,数据的不确定性越高;熵越小,数据的不确定性越低。公式如下:对于一个系统中,可能有k类的信息,每一类信息所占的比例就叫做pi。举个例子来理解这个公式,如下:右边的计算结果比左边的小,也就是右边的数据比左边的数据更确定。由于右边的数据中的第三类数据占很大原创 2020-07-18 18:11:17 · 318 阅读 · 0 评论