《机器学习实战》第九章“树回归”P164的程序清单9-2出现这个错误,经过多方测试,最终解决。
- 首先在p163的测试中就出了错误,发现返回的mat1只有一行,通过调试发现
def binSplitDataSet(dataSet, feature, value):
mat0 = dataSet[nonzero(dataSet[:,feature] > value)[0],:][0]
mat1 = dataSet[nonzero(dataSet[:,feature] <= value)[0],:][0]
return mat0,mat1
这里是有错的,应该改为:
def binSplitDataSet(dataSet, feature, value):
mat0 = dataSet[nonzero(dataSet[:,feature] > value)[0],:]
mat1 = dataSet[nonzero(dataSet[:,feature] <= value)[0],:]
return mat0,mat1
- 对于问题
TypeError: unhashable type: 'matrix'
即matrix类型不能被hash,找到对应的出问题的matrix
在函数chooseBestSplit
处
将
for splitVal in set(dataSet[:,featIndex]):
改为:
for splitVal in set((dataSet[:,featIndex].T.A.tolist())[0]):
即可。