这段时间小伙伴们都在忙着面试,然后各种被吊打,所以我觉得是该把以前的东西给捡起来了;今天白天温习了一下决策树的几种基本算法
不过再讲决策树之前,还是先吧一些基本的统计学中的概念讲清楚比较好
首先是:熵--熵是衡量一个数据集内类的混乱情况的量,熵越大,复杂程度越高,类就越混杂,熵的计算公式如下:
这段时间小伙伴们都在忙着面试,然后各种被吊打,所以我觉得是该把以前的东西给捡起来了;今天白天温习了一下决策树的几种基本算法
不过再讲决策树之前,还是先吧一些基本的统计学中的概念讲清楚比较好
首先是:熵--熵是衡量一个数据集内类的混乱情况的量,熵越大,复杂程度越高,类就越混杂,熵的计算公式如下: