由于许多不同的原因,决策树是一种常见的监督学习技术。 决策树的优点包括我们可以将它们用于分类和回归,它们不需要特征缩放,而且决策树易于阅读。
本文介绍了 Python 的 Graphviz 来显示决策树。
在 Python 中可视化树
Graphviz 或图形可视化是一种开源软件,它将结构信息表示为抽象图形和网络的图表。 例如,Graphviz 在数据科学中的一种用途是可视化决策树。
安装 Graphviz 包
安装 Graphviz 通常需要将点文件转换为图像文件(PNG、JPG、SVG 等),这取决于您的操作系统和其他几个因素。
如果您收到错误 dot: command not found
,可能是您还没有安装 dot 语言。
要安装 Graphviz,请运行以下命令。
- Windows:
winget install graphviz
- Mac:
brew install graphviz
- Ubuntu:
sudo apt install graphviz
更多安装过程,如手动下载可执行文件和其他版本,您可以查看 Graphviz 官方文档。
安装后,验证您的 Graphviz 安装是否在其安装目录中包含 dot.exe 文件,因为稍后我们将需要它来生成点文件的可视化。 通常,默认安装路径在 C:\Program Files\Graphviz\bin 下。
将树转换为点文件
Graphviz 的要求之一是点格式的树,但首先,我们需要一个示例树。 我们可以转到这篇关于树如何在 Python 中工作的文章,或者我们可以使用下面的命令来方便地阅读本文。
示例代码:
tree = 'digraph G {Hello->World}'
open('sample.dot','w').write(tree)
上面的代码片段将一个简单的 Hello->World 2 节点树结构写入满足我们要求的 sample.dot 文件。 然而,如果我们想要一个更复杂的树,我们可以使用这个在线树生成器,它也可以方便地让我们直接以点格式下载它。
将点文件转换为图像
现在我们有了点文件,我们需要使用点应用程序在 Graphviz 中运行它。 早些时候,我们要求您记下我们的 Graphviz dot.exe 路径,因为我们将在本节中需要它。
在命令提示符下使用命令 cd 转到 dot.exe 路径。
cd C:\Program Files\Graphviz\bin
我们这样做是因为在大多数情况下,Graphviz 安装不在我们的环境变量中包含点,因此我们可以使用 dot.exe
来运行以下代码片段。
# dot.exe -Tpng <path of the dot file> -o <destination path of the png file>
dot.exe -Tpng C:\PS\sample.dot -o C:\PS\sample.png
执行后,这应该会产生使用 PNG 格式的树的可视化表示。