决策树算法
ID3和C4.5实现鸾尾花分类预测
ID3和C4.5算法原理简单介绍
1、这两个算法差别不是特别大,一个是用信息增益来判断,一个是用信息增益率来判断,在sklearn库中指定 criterion=“entropy” 即可,只是准确度不一样。
2、这两个算法只能做分类,不能做回归。
实现对鸾尾花数据的分类预测
导入相关的包
# coding=utf-8
from sklearn.datasets import load_boston,load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
加载数据
#准备数据
feature = load_iris()['data']
label = load_iris().target
train_feature,test_feature,train_label,test_label = train_test_split(feature,label,test_size=0.3,random_state=0)
创建分类树–预测结果
#创建树结构 -- 信息熵
tree = DecisionTreeClassifier(criterion="entropy")
#拟合数据模型
tree_model = tree.fit(train_feature,train_