解决pycharm中导入graphviz生成决策树中文乱码问题
在pycharm里基于sklearn的wine数据生成决策树,遇到了决策树中文乱码的问题,是因为graphviz默认的fontname为helvetica,
不能很好的显示中文。试了网上其他方法,对自己的电脑没有反应,摸索到了一个方法。
程序代码
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
import pandas as pd
import graphviz
wine = load_wine()
Xtrain, Xtest, Ytrain, Ytest = train_test_split(wine.data, wine.target, test_size=0.3)
# print(Xtrain.shape) # 输出训练集的形状
# print(Xtest.shape)
clf = tree.DecisionTreeClassifier(criterion='entropy') # 实例化
clf = clf.fit(Xtrain, Ytrain)
score = clf.score(Xtest, Ytest) # score 指的是预测准确度
print(score)
feature_name = ['酒精', '苹果酸', '灰', '灰的碱性', '镁', '总酚', '类黄酮', '非黄烷类酚类', '花青素', '颜色强度', '色调', 'od280/od315稀释葡萄酒', '脯氨酸']
dot_data = tree.export_graphviz(clf
, feature_names=feature_name
, class_names=['琴酒', '雪莉', '贝尔摩德']
, filled=True
, rounded=True
)
graph = graphviz.Source(dot_data)
graph.render("tree") # 在同级目录下生成pdf文件
程序运行结果
1.运行结果
运行产生一个pdf文件,存储生成的决策树,但是中文是乱的。同时生成一个tree.dot 文件。
2. tree.dot 文件
打开该文件找到第2行和第3行的fontname=helvetica,将字体类型helvetica更改为中文字体类型,windows上的一些中文字体类型如下:
3. 在graphviz的安装目录搜索找到找到gvedit.exe文件,具体操作见下面博主的连接。
使用GraphViz可视化dot文件时,不一定在命令行启动
我的电脑早命令行没有办法启动,报错。gvedit.exe文件操作很简单,很简单。
希望能够帮助大家。