全文共2487字,预计学习时长7分钟
图源:unsplash
机器学习已然成为许多领域的大热词。但其实,真正了解机器学习的人还是少数,大多数人属于以下两个阵营:
· 不懂机器学习算法;
· 知道算法是如何工作的,但不知道为什么会工作。
因此,本文试图阐述算法的工作流程和内容,尽力直观地解释其中的工作原理,希望能让你对此有豁然开朗之感。
决策树
决策树用水平线和垂直线划分特征空间。下图是一个简单的决策树,有一个条件节点和两个类节点,表示一个条件以及判断满足该条件的节点属于哪个类别。
请注意,标记为不同颜色的字段与该区域内实际是该颜色或熵的数据点之间有很多重叠。要以最小化熵构造决策树,这种情况下,可以添加一个额外的复杂层。如果加入另一个条件(x<6,y>6),可以把相应区域的点标为红色。这个移动降低了熵值。
<