机器学习-模型训练及测试

最新推荐文章于 2024-10-12 17:26:01 发布

Yangwenyi115615

最新推荐文章于 2024-10-12 17:26:01 发布

阅读量3.1k

点赞数

本文链接：https://blog.csdn.net/Yangwenyi115615/article/details/89706200

版权

模型选择：对不同的任务选择不同的方法，最终的目的是选择最优的建模方法。
模型训练：把数据集分为两部分，训练集和测试集。用训练集作为模型的训练；测试集作为评估模型的好坏。如果模型的效果不好，就需要重新更改数据、更改特征工程或者更改模型参数，来重新训练模型。在模型训练的时候，训练集会自动进行数据模型参数的修改，最终会返回最优的参数模型，这种方式成为交叉验证(将训练集分为子训练集和验证集)
模型训练尽可能多的选择不同的算法进行训练与测试，比较执行的结果，选择一个最优的算法。
模型测试：
1、分类模型的测试评估指标，分别是准确率、召回率、精确率、F值
准确率（accuracy）：预测正确的样本/总样本
召回率（recall）：预测正确的正例样本/样本中的正例样本
男(预) 女(预) 正例
男(真) A B A/(A+B)
女(真) C D
精确率（precision）：正确的正例样本/预测为正例的样本
预测预测正确预测错误召回率
80 70 10 70/80
F值：precision * recall * 2 / (precision + recall)
此外，还有ROC/AUC指标。
2、回归模型的测试评估指标，分别是：RMSE、MSE(均方差)、MAE(绝对误差)、R2

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Yangwenyi115615

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python从0到100（六十）：机器学习-模型选择与交叉验证

Hello大家好，我是Dream，如果帮得到你，那我深感荣幸！交流学习、商务合作：https://bbs.csdn.net/topics/614347534

09-30

3万+

交叉验证：将拿到的训练数据，分为训练和验证集。以下图为例：将数据分成5份，其中一份作为验证集。然后经过5次(组)的测试，每次都更换不同的验证集。即得到5组模型的结果，取平均值作为最终结果。又称5折交叉验证。交叉验证是评估机器学习模型性能的重要手段，它通过多次训练和验证来提高模型评估的准确性和可靠性。结合网格搜索，可以有效地进行超参数调优，从而获得更好的模型性能。在实际应用中，应根据数据特性和需求选择合适的交叉验证方法和参数。

Python从0到100（五十一）：机器学习-线性回归及加州房价预测

最新发布

weixin_45320238的博客

10-12

667

模型训练经验

05 模型训练和测试

weixin_33711641的博客

09-25

878

一、模型训练 1、模型选择定义：面向任务，选择最优的建模方法和参数。建模可以使用不同的 “图纸” ：Logistic、SVM、Bayes ，根据三个不同的图纸，选择最像任务目标的模型。这是一种的过程。根据Logistic回归，设置不同的参数，比如Logistic回归有个参数alpha，分别设置为0...

Windows下mnist数据集caffemodel分类模型训练及测试

weixin_30555125的博客

06-21

227

1. MNIST数据集介绍 MNIST是一个手写数字数据库，样本收集的是美国中学生手写样本，比较符合实际情况，大体上样本是这样的： MNIST数据库有以下特性：包含了60000个训练样本集和10000个测试样本集；分4部分，分别是一个训练图片集，一个训练标签集，一个测试图片集，一个测试标签集，每个标签的值是0~9之间的数字；原始图像归一化大小为28*2...

13-模型训练及测试

weixin_30561177的博客

08-16

353

模型选择:对特定任务最优建模方法的选择或者对特定模型最佳参数的选择在训练数据集上运行模型(算法)并在测试数据集中测试效果,迭代进行数据模型的修改,这种方式呗称为交叉验证(将数据分为训练集和测试集,使用训练集构建模型,并使用测试i集评估模型提供修改建议) 模型的选择会尽可能多的选择算法进行执行,并比较执行结果模型的测试一般以以下几个方面进行比较,分别是准确率/召回率/精准率/F值　　准...

Stacking:机器学习集成模型之堆叠各种模型及工具源码-机器学习

03-24

目前，大型的数据挖掘比赛（如Kaggle），排名靠前的基本上都是集成机器学习模型或深度神经网络。将训练好的所有基模型对整个训练集进行预测，第$ j $个基模型对第i个训练样本的预测值将作为新的训练集中第$ i $个...

机器学习系统的质量要素与测试方法.pdf

09-24

总结来说，机器学习系统的质量测试不仅关注模型的预测能力，还涉及数据质量、模型训练过程、系统架构和运行环境等多个层面。通过构建合适的测试框架和选用恰当的测试方法，可以有效提高机器学习系统的可靠性和安全性...

【机器学习】机器学习模型训练与测试评估

Daycym的博客

11-19

3489

模型训练模型选择对于特定任务最优建模方法的选择或者对特定模型最佳参数的选择交叉验证在训练数据集上运行模型（算法）并且在测试数据集上测试效果，迭代更新数据模型的修改，这种方式被称为“交叉验证”（将数据分为训练集和测试集），使用训练集构建模型，并使用测试集评估模型提供修改建议。模型的选择会尽可能多的选择算法进行执行，并比较每个算法的执行结果模型测试模型的测试一般从以下几...

【24】目标检测模型SSD的搭建及其训练与测试

Clichong

09-24

1622

参考资料：https://zh-v2.d2l.ai/chapter_computer-vision/ssd.html 其中代码稍有修改文章目录1. 模型搭建2. 自定义数据集3. 模型训练4. 模型测试 1. 模型搭建这里直接贴上代码，这部分框架比较清晰，没有改动，可以正常使用。 SSD的框架图：详细具体的搭建流程可以查看参考资料，以下是参考代码： # 以下属于ssd模型的定义 def cls_predictor(num_inputs, num_anchors, num_classes): .

直观的模型训练及测试效果

apple_53439775的博客

04-03

1863

在之前完整的训练模型中只是做到了成功训练，也有损失函数但是在大量数据集、多次训练的情况下，数据较多，并不直观，而且没有做测试。在这里添加了测试模块，并且为了进一步直观的测试效果，添加了正确率 #测试 total_test_loss = 0 total_accuracy = 0 with torch.no_grad(): for data in test_dataloader: imgs, targets = data

（三）训练模型_测试模型_分类别打印模型准确率

qq_52156377的博客

09-04

343

【代码】（三）训练模型_测试模型_分类别打印模型准确率。

神经网络1.训练和测试（train&test）以及相关关系解释--神经网络开篇

不积跬步无以至千里

12-29

1万+

现实生活中计算机是没法像人类一样的认识事物的，所以人类一直致力于这方面的研究。前辈们已经开发了许多的方法以实现计算机识别的能力，比如SVM等。但是目前来说最火且具有最高识别度的还是深度学习。有许许多多的人投身于中。可以说我们赶上了时代的列车。

Pytorch入门（三）训练 / 测试模型

一只废佐_的博客

11-13

6709

上一篇文章中讲解了神经网络模型的编写，一般情况下，我们只需要对现有的网络模型进行修改就可以了，那这篇文章就进入到最重要的部分了，也就是网络模型的训练和测试。其实对于分类和回归的模型（可以理解为分类就是将回归模型离散化，而回归就是将分类问题连续化，说人话就是回归模型输出了一些具体的数值像坐标这种，而分类就是将回归的数值经过softmax等函数进行离散，就大概是这个意思），是有一套完整的套路的，就是说你完全可以自己写出来一套“模板”，在使用分类或者回归模型时，直接套用就ok了。

机器学习——模型评估

qq_53142796的博客

02-27

485

而查全率是被分类器正确分类为正类的比例。为此，需使用一个“测试集”(testing set）来测试模型对新样本的泛化能力，然后以测试集上的“测试误差( tootino error)作为泛化误差的近似。将数据集分层采样划分为k个大小相似的互斥子集，每次用k-1个子集的并集作为训练集，余下的子集作为测试集，最终返回k个测试结果的均值，k最常用的取值是10。将数据集分层采样划分为k个大小相似的互斥子集，每次用k-1个子集的并集作为训练集,余下的子集作为测试集，最终返回k个测试结果的均值，k最常用的取值是10。

机器学习系列（五）——训练集、测试集、验证集与模型选择

zxhohai的博客

07-12

4万+

在机器学习过程中，为了找到泛化性能最好的那个函数，我们需要确定两方面的参数：1、假设函数参数，也就是我们通常所说的www和bbb，这类参数可以通过各种最优化算法自动求得。2、模型参数，比如多项式回归中的多项式次数，规则化参数λλ\lambda等，这些参数被称为超参数，一般在模型训练之前通过手工指定（当然也可以采用网格法等算法进行寻优）。确定模型超参数的过程称为模型选择。模型选择借用吴恩...

猫狗分类数据集：机器学习模型训练与测试

在实际使用该数据集时，需要注意文件的具体格式和内容，以便正确地加载数据、进行预处理和模型训练，并使用样本提交文件来提交最终的预测结果。此外，根据实际应用和模型的需要，数据集可能还会进行进一步的划分，如...