Python机器学习——决策树
利用sklearn实现参考代码
- 解决问题:经典分类问题(鸢尾花分类)
from sklearn import datasets #导入数据集包
iris=datasets.load_iris()
- 选取出数据集(features)和标记(target)
import pandas as pd
features=pd.DataFrame(iris.data,columns=iris.feature_names)
target= pd.DataFrame(iris.target,columns=['type'])
- 导入划分数据集的包并划分训练数据集和测试数据集和各自的标记
from sklearn.model_selection import train_test_split
train_feature,test_feature,train_targets,test_targets=train_test_split(features,target,test_size=0.33,random_state=42)
- 导入决策树分类模型
from sklearn.tree import DecisionTreeClassifier ##随机数分类模型
model=DecisionTreeClassifier() #模型
model.fit(train_feature,train_targets)#拟合模型
model.predict(test_feature) #对测试数据进