作者: 王彦平
开始前的准备工作
首先导入所需库文件,numpy,pandas用于数值处理,DictVectorizer用于特征处理,graphviz用于模型可视化。
#导入所需库文件
import numpy as np
import pandas as pd
from sklearn.feature_extraction import DictVectorizer
from sklearn import cross_validation
from sklearn import tree
import graphviz
导入所需的数据文件,用于训练和评估模型表现。
#导入数据表 test=