适用类型:数值型和标称型。
优点:对中间值的缺失不敏感。
寻找划分数据集的最好特征——信息增益
划分数据集——最大信息增益
array类型不具有append()方法,需要强转为list类型。
#使用pickle模块存储决策树
def storeTree(inputTree, filename):
import pickle
fw = open(filename, ‘wb’, 0)#wb的写入方式才行
pickle.dump(inputTree, fw)#序列化对象,保存到fw文件中
fw.close()
def grabTree(filename):
import pickle
fr = open(filename,‘rb’)#rb的读取方式才行
return pickle.load(fr)#反序列化对象,将文件中的数据解析为一个python对象。