一般树的结构
根据数据集我们可以提取出特征
色泽:青绿、乌黑、浅白
根蒂:蜷缩、稍蜷、硬挺
敲声:浊响、沉闷、清脆
纹理:清晰、稍糊、模糊
脐部:凹陷、稍凹、平坦
触感:硬滑、软粘
如果我们就单纯的使用这些特征构造一棵树
这样的话我们就穷举出西瓜所有可能存在的特征组合。但是这种方法有一下的一些问题:
1.我们使用穷举的方法,树会非常的大。特征向量没增加一维,构造树的空间复杂度和事件复杂度都会呈指数上升。
2.我们数据集中的数据有可能是噪声点。如这个特征组合的西瓜在现实世界中本来是好瓜,但是数据集中将其判断为坏瓜了,这样我们再次遇到同样特征的西瓜可能会误判。
3.模型会过拟合,对现实世界中的西瓜的泛化能力不强。
4.遍历这种树来获取信息的速度很慢。