def readDataSet(filePath):
"""
函数说明:读取数据集
parameters:
filePath - 数据集文件路径
returns:
dataSet - 数据集
labels - 分类属性
"""
# 初始化数据集
dataSet = []
# 读取数据
with open(filePath, 'r') as f:
# 遍历每一行数据
for line in f.readlines():
# 去掉每行的空格并将数据分割成列表
line = line.strip().split()
# 将每一行的数据添加到数据集
dataSet.append(line)
# 数据集中实现了在no和lenses之间加入一个下划线,并将最后的标签整合为一个字符串。
for i in range(len(dataSet)):
#dataSet[i] = dataSet[i].replace("no lenses", "no_lenses")
if(dataSet[i][-2] == 'no'):
dataSet[i][-1] = dataSet[i][-2] + '_' + dataSet[i][-1]
dataSet[i] = dataSet[i][:-2] + [dataSet[i][-1]]
# 获取数据的分类属性
labels = ['age', 'prescr
local variable ‘classLabel‘ referenced before assignment Python机器学习_决策树DecisionTree中一个报错解决方法
于 2023-02-10 17:31:23 首次发布