通过代码修改解决Graphviz中出现的中文乱码问题

通过代码修改解决Graphviz中出现的中文乱码问题

Graphviz中出现的中文乱码问题

Graphviz中出现的中文乱码基本上在安装后都会出现的问题,其实这是很正常的,在许多的国外软件开发中都不会自带中文字体,大部分都需要对源代码进行修改,然后才能识别中文以及转换为中文。Graphviz也不例外,其源代码自带的字体并不支持中文显示,所以需要进行修改。

一、出现问题的情形

之前我的代码是这样的

import graphviz
dot_data = tree.export_graphviz(clf
                                ,out_file=None
                                ,feature_names=feature_name
                                ,class_names= ["琴酒","雪莉","贝尔摩德"]
                                ,filled = True
                                ,rounded = True)
graph = graphviz.Source(dot_data)
graph.view()

这个代码虽然也能得到pdf文件,但是中文会出现乱码的情况。
在这里插入图片描述

二、解决中文乱码的问题

修改字体的源代码

对于各个版本不同修改代码的样式也不尽相同,大家可以尝试下,不过要对原来的代码进行留影保存,以便于返回。由于我是通过Anaconda安装的Graphviz所以我对应的fonts软件在D:\Anaconda3.0\pkgs\graphviz-2.38-hfd603c8_2\Library\fonts里面,大家根据自己的安装位置寻找哈。找到fonts.conf文件,采用记事本打开大家对在这里插入图片描述
大家对Font directory list 和Font directory list 按照我的代码进行修改,改为

C:\WINDOWS\Fonts 和C:\Windows\Fonts ,这样就可以调用微软的字体了。

修改Graphviz的代码

我的代码是基于windows系统的在pycharm编译器中编写的,跟jupyter不同的,代码调用如下:

import graphviz
dot_data = tree.export_graphviz(clf
                                ,out_file=None
                                ,feature_names=feature_name
                                ,class_names= ["琴酒","雪莉","贝尔摩德"]
                                ,filled = True
                                ,rounded = True)
graph = graphviz.Source(dot_data.replace('helvetica','"Microsoft YaHei"'), encoding='utf-8')
graph.render('wine',)

最终得出的结果就不会出现中文乱码啦!
在这里插入图片描述
希望对大家有所帮助!

  • 7
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
你可以尝试以下方法解决graphviz决策树中文乱码问题: 1. 确保你的电脑上已经安装了Graphviz软件,并且将它的可执行文件路径添加到系统环境变量。 2. 在生成决策树的代码,设置相关的参数来支持文字符。例如,在使用sklearn库的DecisionTreeClassifier类进行决策树训练时,可以设置参数`feature_names`和`class_names`为文字符。 ```python from sklearn import tree # 定义特征名称和类别名称 feature_names = ['特征1', '特征2', ...] class_names = ['类别1', '类别2', ...] # 创建决策树分类器 clf = tree.DecisionTreeClassifier(...) # 训练模型 clf.fit(X, y) # 生成决策树图形 dot_data = tree.export_graphviz(clf, feature_names=feature_names, class_names=class_names, filled=True, rounded=True, special_characters=True) ``` 3. 使用Python的pydotplus库将生成的dot文件转换为图像文件,以便展示决策树。 ```python import pydotplus # 将dot数据加载到图形对象 graph = pydotplus.graph_from_dot_data(dot_data) # 保存为图像文件(例如PNG格式) graph.write_png('decision_tree.png') ``` 4. 如果仍然遇到中文乱码问题,可以尝试使用字体文件来显示文字符。首先,下载一个包含文字体的TrueType字体文件(例如simsun.ttf),然后在代码指定字体文件路径。 ```python # 设置字体文件路径 font_path = 'path_to_fonts/simsun.ttf' # 创建决策树图形时,指定字体参数 dot_data = tree.export_graphviz(clf, feature_names=feature_names, class_names=class_names, filled=True, rounded=True, special_characters=True, font_name=font_path) ``` 尝试上述方法,应该能够解决graphviz决策树中文乱码问题。如果仍然存在困扰,请提供更多详细信息以便我能够更好地帮助你。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值