CART、ID3和C4.5算法
决策树算法
ID3和C4.5实现鸾尾花分类预测
ID3和C4.5算法原理简单介绍
1、这两个算法差别不是特别大,一个是用信息增益来判断,一个是用信息增益率来判断,在sklearn库中指定 criterion=“entropy” 即可,只是准确度不一样。
2、这两个算法只能做分类,不能做回归。
实现对鸾尾花数据的分类预测
导入相关的包
# coding=utf-8
from sklearn.datasets import load_boston,load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
加载数据
#准备数据
feature = load_iris()['data']
label = load_iris().target
train_feature,test_feature,train_label