数据挖掘实验1.完成时间:2022.11.29。仅供参考
相关文章:用python实现决策树分类实验报告
数据源及代码:
链接:https://pan.baidu.com/s/1OjRUSajy4aHcVFqD9ZY8Uw
提取码:sovc
1、环境配置
概述:windows10 python3.9
需要用到的库:pandas、sklearn、numpy、graphviz
2、文件说明
主要: tree-2.py、Source.gv、Source.pv.pdf
可供尝试的方法二: tree.py、tree.dot、tree.png
可视化测试文件: test.py、测试.pv、测试.gv.pdf
3、代码测试
正常流程:在IDE中打开tree-2.py,配置好相关环境后直接运行即可,会生成Source.pv.pdf,i为BLCA,k为BRCA(内容如下)
需要修改的话: tree-2.py。红框内修改文件路径,蓝框内修改对应癌症类型名称,上面那个对应最后class=i,下面那个对应class=k。
PS:graphviz环境的配置
1、安装好Graphviz后,在VSC内可安装Graphviz Interactive Prev插件,在VSC中打开生成的tree.dot文件。
右侧自动会生成预览(未生成的话,在vsc内部命令面板中运行第一个插件提供的命令 graphviz interactive: preview (beside)
)
2、安装Graphviz库的教程
(1)去官网(Graphviz)下载最新稳定版,然后在电脑命令行输入
dot -v
确定已安装
(2)然后,我们需要在python使用时输出我们画的图还需要安装一下graphviz的包
打开Anaconda Prompt(win10在电脑左下方搜索框就能找到) 输入pip install graphviz
或者conda install graphviz
如果报错,则选择安装python-graphviz,conda install python-graphviz
(3)在VSC的settings.json文件中添加路径
文件→首选项→设置,点击右上角json
添加下面这句话(记得修改路径到自己安装的位置)
"graphvizPreview.dotPath": "D:\\Graphviz\\bin\\dot.exe"
(4)这个时候就搞定了,可以用下述代码测试(对应test.py)
from graphviz import Digraph
import os
os.environ["PATH"] += os.pathsep + 'D:/Program Files/Graphviz/bin/'
dot = Digraph('测试')
dot.node("1", "Hello")
dot.node("2", "World")
dot.edge('1', '2')
dot.view()
生成