python决策树二分类_决策树分类精度

最新推荐文章于 2023-04-02 11:43:32 发布

杀心成焚

最新推荐文章于 2023-04-02 11:43:32 发布

阅读量842

点赞数

文章标签： python决策树二分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32506617/article/details/113970589

版权

您似乎没有将数据集拆分为单独的培训和测试数据集。这样做的结果是，您的分类器可能过度拟合数据集，并且可能无法很好地处理来自数据集外部的样本。在

尝试随机选择(比如)75%的数据进行训练，然后用剩下的25%测试准确率。例如，替换代码的最后一部分：import random

dataset, labels = load_csv('data/basketball.train.csv')

random.shuffle(dataset)

split_index = int(len(dataset) * 0.75)

train_dataset = dataset[:split_index]

test_dataset = dataset[split_index:]

mytree = createTree(train_dataset, labels)

predictions=[]

for row in test_dataset:

prediction = classify(mytree, ["location","w","final_margin","shot_number","period","game_clock","shot_clock","dribbles","touch_time",

"shot_dist","pts_type","close_def_dist"], [row[0],row[1],row[2],row[3],row[4],row[5],row[6],row[7],row[8],

row[9],row[10],row[11]])

#print('Expected=%s, Got=%s' % (row[-1], prediction))

predictions.append(prediction)

actual = [row[-1] for row in test_dataset]

accuracy = accuracy_metric(actual, predictions)

print(accuracy)

(注：未测试)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python决策树二分类_决策树分类精度

您似乎没有将数据集拆分为单独的培训和测试数据集。这样做的结果是，您的分类器可能过度拟合数据集，并且可能无法很好地处理来自数据集外部的样本。在尝试随机选择(比如)75%的数据进行训练，然后用剩下的25%测试准确率。例如，替换代码的最后一部分：import randomdataset, labels = load_csv('data/basketball.train.csv')random.shuff...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。