可视化—解决graphviz保存决策树中文乱码问题

import pandas as pd
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.preprocessing import LabelEncoder
import graphviz
import matplotlib as mpl

data = pd.read_excel('data/sales_data.xls', index_col='序号')

data[data == '好'] = 1
data[data == 
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以尝试以下方法解决graphviz决策树中文乱码问题: 1. 确保你的电脑上已经安装了Graphviz软件,并且将它的可执行文件路径添加到系统环境变量中。 2. 在生成决策树的代码中,设置相关的参数来支持中文字符。例如,在使用sklearn库的DecisionTreeClassifier类进行决策树训练时,可以设置参数`feature_names`和`class_names`为中文字符。 ```python from sklearn import tree # 定义特征名称和类别名称 feature_names = ['特征1', '特征2', ...] class_names = ['类别1', '类别2', ...] # 创建决策树分类器 clf = tree.DecisionTreeClassifier(...) # 训练模型 clf.fit(X, y) # 生成决策树图形 dot_data = tree.export_graphviz(clf, feature_names=feature_names, class_names=class_names, filled=True, rounded=True, special_characters=True) ``` 3. 使用Python的pydotplus库将生成的dot文件转换为图像文件,以便展示决策树。 ```python import pydotplus # 将dot数据加载到图形对象中 graph = pydotplus.graph_from_dot_data(dot_data) # 保存为图像文件(例如PNG格式) graph.write_png('decision_tree.png') ``` 4. 如果仍然遇到中文乱码问题,可以尝试使用字体文件来显示中文字符。首先,下载一个包含中文字体的TrueType字体文件(例如simsun.ttf),然后在代码中指定字体文件路径。 ```python # 设置字体文件路径 font_path = 'path_to_fonts/simsun.ttf' # 创建决策树图形时,指定字体参数 dot_data = tree.export_graphviz(clf, feature_names=feature_names, class_names=class_names, filled=True, rounded=True, special_characters=True, font_name=font_path) ``` 尝试上述方法,应该能够解决graphviz决策树中文乱码问题。如果仍然存在困扰,请提供更多详细信息以便我能够更好地帮助你。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值