挖掘数据集wine
自定义参数,实现基于决策树的分类(绘图)
准备工作:载入数据,查看数据特征
基于决策树的分类(绘图)
划分特征feature_name可以自行输入列表也可通过提取所需特征的列名,class_names则是写入需要分的类别,现有数据分酒类,即红酒,白酒,葡萄酒
有关graphviz的安装包导入流程(基于泰坦尼克号数据对现实生存法则的研究分析7.2决策树模块)
结论如下:
红酒:od280/od315稀释葡萄酒含量大于2.115,酒精含量大于12.81,脯氨酸含量大于655.0,镁含量小于135.5,色调大于0.76
白酒:od280/od315稀释葡萄酒含量大于2.115,酒精含量小于12.81
葡萄酒:od280/od315稀释葡萄酒含量小于2.115,色调小于1.005,类黄酮含量小于1.58