在<<机器学习实战>>的决策树的存储这方面内容学习过程中,进行代码调试时遇到以下两个错误:
(1)TypeError: write() argument must be str, not bytes
(2)UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence
初始代码如下:
#使用pickle模块存储决策树
#将inputTree存入文件
def storeTree(inputTree,filename):
import pickle
fw=open(filename,'w')
pickle.dump(inputTree,fw)
fw.close()
#读取文件中的inputTree
def grabTree(filename):
import pickle
fr=open(filename)
return pickle.load(fr)
原因分析:
(1)造成问题一的原因在于pickle模块进行存储时默认为二进制存储,而我打开文件方式未调整为对应的二进制格式,应改为'wb+'
(2)造成问题二的原因类似,打开文件进行读取时应设为'rb'
修改后源码:
#使用pickle模块存储决策树
def storeTree(inputTree,filename):
import pickle
fw=open(filename,'wb+')
pickle.dump(inputTree,fw)
fw.close()
def grabTree(filename):
import pickle
fr=open(filename,'rb')
return pickle.load(fr)