机器学习·L2W3-模型评估

最新推荐文章于 2024-09-12 21:05:39 发布

0xMayL

最新推荐文章于 2024-09-12 21:05:39 发布

阅读量749

点赞数 9

分类专栏：机器学习 # 模型评估文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/2301_80132162/article/details/140984687

版权

机器学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

模型评估

2 篇文章 0 订阅

订阅专栏

模型评估

划分数据集为训练集、验证集、测试集

60%训练集、20%测试集和验证集

x_train,x_,y_train,y_=train_test_split(X_train,y_train,test_size=0.4)
x_cv,x_test,y_cv,y_test=train_test_split(x_train,y_train,test_size=0.5)

交叉验证-模型选择

使用交叉验证计算模型的损失 $J_{cv}(w,b)$ 来评估和选择表现最好的模型。
不能使用测试集来选择模型：因为测试集是对模型效果的乐观估计！

模型选择

偏差和方差

回归问题：不是从预测数据和原始数据来看，而主要指的是训练集和验证集的损失
分类问题：分类错误的比例

偏差和方差客观反映了模型的拟合情况：欠拟合和过拟合

在这里插入图片描述

高偏差bias

$J_{train}=J_{cv}且J_{train}较大$

大小上训练集和验证集差不多，但是训练集的损失较大

高方差variance

$J_{train}<<J{cv}$

验证集与训练集的损失有较大出入，且验证集明显大于训练集

正则化

正则化系数 $\lambda$ 越大，拟合曲线就越趋于平缓，偏差越大。

学习曲线

在这里插入图片描述

模型改进

模型改进主要思路是：高偏差就改进拟合的模型，高方差就增多训练集

高偏差

增加训练集大小无用，模型欠拟合
增加更多特征：多项式化数据
减小正则化参数 $\lambda$

高方差

增加训练集大小有效减少过拟合情况
减小特征大小
增大正则化参数 $\lambda$

神经网络的改进

在这里插入图片描述

高偏差

更大的神经网络

高方差

更多的训练集

迁移学习

在这里插入图片描述

套用别人训练的参数，改进自己的输出层，可以在自己的数据量小的情况下有良好表现
要求输入层特征数二者保持一致，输出层可以改变

*分类评估指标

准确率Accuracy

略

精确率precision和召回率recall

精确率表征的是预测的准确性
召回率表征的是实际的准确性

在这里插入图片描述

F1-score

一种准确率和召回率的权衡方法，用于评估不同分类模型的效果

在这里插入图片描述

0xMayL

关注

9
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录