[matplotlib] 绘制Cross-Validation的误差图

概述:

在调整模型参数的时候,往往会进行交叉验证(Cross-Validation)。绘制交叉验证的误差图。

数据:

k是需要调整的参数, 从k_choices中选取

k_choices = [1, 3, 5, 8, 10, 12, 15, 20, 50, 100]

假设经过验证以后k_to_accuracies字典里保存了k取不同值时多次验证的准确性:

k_to_accuracies = {
    1: [0.24, 0.23, 0.24, 0.25, 0.29],
    3: [0.17, 0.23, 0.32, 0.22, 0.23],
    5: [0.12, 0.21, 0.27, 0.19, 0.18],
    8: [0.13, 0.23, 0.26, 0.16, 0.2],
    10: [0.16, 0.18, 0.24, 0.16, 0.19],
    12: [0.17, 0.19, 0.24, 0.2, 0.26],
    15: [0.17, 0.23, 0.19, 0.12, 0.14], 
    20: [0.12, 0.17, 0.19, 0.12, 0.2],
    50: [0.2, 0.16, 0.17, 0.16, 0.14], 
    100: [0.16, 0.15, 0.19, 0.19, 0.19],
}

绘图

绘图的代码如下:

for k in k_choices:
  accuracies = k_to_accuracies[k]
  plt.scatter([k] * len(accuracies), accuracies)

# plot the trend line with error bars that correspond to standard deviation
accuracies_mean = np.array([np.mean(v) for k,v in sorted(k_to_accuracies.items())])
accuracies_std = np.array([np.std(v) for k,v in sorted(k_to_accuracies.items())])
plt.errorbar(k_choices, accuracies_mean, yerr=accuracies_std)
plt.title('Cross-validation on k')
plt.xlabel('k')
plt.ylabel('Cross-validation accuracy')
plt.show()

这里写图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要画出cross validation error与岭回归的λ的像,需要进行以下步骤: 1. 定义岭回归的模型。 2. 选择一组合适的λ值,生成一系列不同的岭回归模型。 3. 对于每个λ值,使用交叉验证方法来计算其对应的平均交叉验证误差。 4. 将λ值与其对应的平均交叉验证误差绘制在坐标系中,得到一条λ-误差曲线。 下面是具体的实现步骤: 1. 定义岭回归模型 假设我们有一个训练集(X_train, y_train),我们可以使用sklearn库中的Ridge类来定义岭回归模型。代码如下: ```python from sklearn.linear_model import Ridge ridge_model = Ridge() ``` 2. 选择一组合适的λ值 我们可以使用numpy库中的logspace函数来生成一组等比数列,作为λ的取值范围。代码如下: ```python import numpy as np n_alphas = 200 alphas = np.logspace(-10, 2, n_alphas) ``` 这里我们生成了200个等比数值,从10的-10次方到10的2次方,用于作为岭回归的λ值。 3. 计算平均交叉验证误差 我们可以使用sklearn库中的cross_val_score函数来计算每个λ值下的平均交叉验证误差。代码如下: ```python from sklearn.model_selection import cross_val_score cv_error = [] for alpha in alphas: ridge_model.set_params(alpha=alpha) scores = cross_val_score(ridge_model, X_train, y_train, cv=10, scoring='neg_mean_squared_error') cv_error.append(np.mean(np.sqrt(-scores))) ``` 这里我们使用10折交叉验证来计算平均交叉验证误差,并且使用均方根误差(RMSE)作为评估指标。 4. 绘制λ-误差曲线 最后,我们可以使用matplotlib库来绘制λ-误差曲线。代码如下: ```python import matplotlib.pyplot as plt plt.figure(figsize=(10, 6)) plt.plot(alphas, cv_error) plt.xlabel('λ') plt.ylabel('平均交叉验证误差') plt.title('岭回归正则化参数与交叉验证误差关系') plt.show() ``` 这里我们使用plt.plot函数来绘制λ-误差曲线,使用plt.xlabel和plt.ylabel函数来设置坐标轴标签,使用plt.title函数来设置像标题。最后使用plt.show函数来显示像。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值