一开始,作者说如果使用准备好的数据集,可以下载他的decision_tree_example.txt。
然后通过my_data = [ line.split('/t') for line in file('decision_tree_example.txt') ]将数据加载进来。但是我发现,如果这样做的话,每行后面那个字符串会有一个回车符/n(我一开始还没注意,后来打印决策树的时候发现不对劲)。
编写个小函数去除最后那个回车符:
def loaddata():
data = []
for line in file('decision_tree_example.txt'):
#去掉回车符
line = line[0:-1]
#分割
data.append(line.split('/t'))
return data
注意:在数据中最后一行后面加一个回车,不然会去除最后一行最后一个字母。本可以在函数中进行操作,但修改数据最简单。
使用时,在python shell中输入data = treepredict.loaddata()。
PS:记录下算是个小小的收获。