机器学习：模型评估

最新推荐文章于 2024-10-06 23:30:01 发布

m0_74238225

最新推荐文章于 2024-10-06 23:30:01 发布

阅读量476

点赞数 22

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74238225/article/details/137837689

版权

本文介绍了模型评估在机器学习中的重要性，通过KNN算法展示了P-R曲线和ROC曲线的应用，强调了评估模型准确性、泛化能力及识别过拟合/欠拟合的方法，常用的指标包括准确率、精确率和召回率。

摘要由CSDN通过智能技术生成

一、为什么要进行模型评估？
模型评估在机器学习和人工智能领域扮演着至关重要的角色。模型评估是确保机器学习模型在实际应用中有效、可靠且符合预期的关键步骤。它不仅帮助开发者理解和改进模型,还为最终用户提供了信心和保证。在模型开发的整个生命周期中,持续和全面的评估对于实现高质量的AI解决方案至关重要。

二、模型评估常用方法？

分类模型常用评估方法：

回归模型常用评估方法：

三、案例应用
以k-NN算法为例，当k取不同值时，分别绘制P-R曲线和ROC曲线，观察曲线变化，以下是具体的代码和结果实现：

（1）P-R曲线
import numpy as np

import matplotlib.pyplot as plt

from sklearn.datasets import make_classification

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

from sklearn.metrics import precision_recall_curve, auc

from sklearn.preprocessing import StandardScaler

# 生成一些样本数据

X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)

# 数据标准化

scaler = StandardScaler()

X = scaler.fit_transform(X)

# 划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 不同k值下的PR曲线

k_values = [1, 3, 5, 7, 9]

plt.figure(figsize=(8, 6))

for k in k_values:

knn = KNeighborsClassifier(n_neighbors=k)

knn.fit(X_train, y_train)

y_score = knn.predict_proba(X_test)[:, 1]

precision, recall, _ = precision_recall_curve(y_test, y_score)

pr_auc = auc(recall, precision)

plt.plot(recall, precision, label=f'k={k}, AUC={pr_auc:.2f}')

plt.xlabel('Recall')

plt.ylabel('Precision')

plt.title('PR Curve for KNN with Different k Values')

plt.legend()

plt.show()

（2）ROC曲线
import numpy as np

import matplotlib.pyplot as plt

from sklearn.datasets import make_classification

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

from sklearn.metrics import roc_curve, auc

from sklearn.preprocessing import StandardScaler

# 生成一些样本数据

X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)

# 数据标准化

scaler = StandardScaler()

X = scaler.fit_transform(X)

# 划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 不同k值下的ROC曲线

k_values = [1, 3, 5, 7, 9]

plt.figure(figsize=(8, 6))

for k in k_values:

knn = KNeighborsClassifier(n_neighbors=k)

knn.fit(X_train, y_train)

y_score = knn.predict_proba(X_test)[:, 1]

fpr, tpr, _ = roc_curve(y_test, y_score)

roc_auc = auc(fpr, tpr)

plt.plot(fpr, tpr, label=f'k={k}, AUC={roc_auc:.2f}')

plt.plot([0, 1], [0, 1], linestyle='--', color='grey', label='Random Guess')

plt.xlabel('False Positive Rate')

plt.ylabel('True Positive Rate')

plt.title('ROC Curve for KNN with Different k Values')

plt.legend()

plt.show()

四.实验总结

通过模型评估，我们可以确定模型的准确性、泛化能力和稳定性，以及是否存在过拟合或欠拟合等问题，常用的评估指标包括准确率、精确率、召回率等。另外，对于不同类型的问题，还可以采用不同的评估方法，如P-R曲线、ROC曲线、混淆矩阵等。综上所述，模型评估在机器学习中是至关重要的，可以帮助我们提高模型的性能和效果。

关注

22
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

m0_74238225 CSDN认证博客专家 CSDN认证企业博客

码龄2年

7: 原创

153万+: 周排名

14万+: 总排名

8102: 访问

: 等级

251: 积分

121: 粉丝

171: 获赞

1: 评论

185: 收藏

私信

关注

热门文章

最新评论

KNN算法
CSDN-Ada助手: 非常感谢您分享关于KNN算法的博客！虽然KNN算法有其明显的优点，但您也在文章中提到了它的一些缺点。持续学习和探索算法的优缺点，可以帮助我们更好地应用它们。除了KNN算法的基本原理和缺点外，您可能还对KNN算法的优化方法感兴趣。比如使用加权KNN算法来减小近邻误差，或者采用特征缩放来改善预测结果。希望您能继续深入研究和实践，不断提升自己在机器学习领域的技能！期待您的更多精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。