机器学习小目标--模型评估与选择

最新推荐文章于 2024-06-13 18:32:50 发布

beautiful_well

最新推荐文章于 2024-06-13 18:32:50 发布

阅读量403

点赞数

分类专栏：数据科学家联盟文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beautiful_well/article/details/103058885

版权

本文介绍了机器学习中的模型评估方法，包括数据拆分为训练和测试集，分类结果的精准度、混淆矩阵、精准率、召回率、F1 Score和ROC曲线，以及回归结果的MSE、RMSE、MAE和R Squared。讨论了超参数的重要性，特别是kNN算法中的k值选择，并解释了混淆矩阵、精准率和召回率的概念。最后，探讨了ROC曲线在评估分类器性能中的作用。

摘要由CSDN通过智能技术生成

学习目标有三个：

数据拆分：训练数据集&测试数据集
评价分类结果：精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等
评价回归结果：MSE、RMSE、MAE、R Squared

1.1 训练数据集&测试数据集

将原始数据中的一部分作为训练数据、另一部分作为测试数据。使用训练数据训练模型，再用测试数据看好坏。即通过测试数据判断模型好坏，然后再不断对模型进行修改。

1.2 分类准确度accuracy

在划分出测试数据集后，我们就可以验证其模型准确率了。在这了引出一个非常简单且常用的概念：accuracy（分类准确度）

accuracy_score：函数计算分类准确率，返回被正确分类的样本比例（default）或者是数量（normalize=False）
在多标签分类问题中，该函数返回子集的准确率，对于一个给定的多标签样本，如果预测得到的标签集合与该样本真正的标签集合严格吻合，则subset accuracy =1.0否则是0.0

因accuracy定义清洗、计算方法简单，因此经常被使用。但是它在某些情况下并不一定是评估模型的最佳工具。精度（查准率）和召回率（查全率）等指标对衡量机器学习的模型性能在某些场合下要比accuracy更好。

1.3 超参数

之前我们都是为knn算法传一个默认的k值。在具体使用时应该传递什么值合适呢？

这就涉及了机器学习领域中的一个重要问题：超参数。所谓超参数，就是在机器学

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习小目标--模型评估与选择

学习目标有三个：数据拆分：训练数据集&测试数据集评价分类结果：精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等评价回归结果：MSE、RMSE、MAE、R Squared 1.1 训练数据集&测试数据集将原始数据中的一部分作为训练数据、另一部分作为测试数据。使用训练数据训练模型，再用测试数据看好坏。即通过测试数据判断模型好坏，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。