2-9 模型评估指标

过于真实呢

于 2024-07-03 08:49:34 发布

阅读量291

点赞数 4

分类专栏： jj的ai之路文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62115482/article/details/140110735

版权

jj的ai之路专栏收录该内容

32 篇文章 0 订阅

订阅专栏

2-9 模型评估指标

主目录点这里
评估指标
评估指标是指在特定任务或项目中，用于衡量、评估、比较性能或效果的量化标准
在这里插入图片描述
这里我要详细说一下混淆矩阵
以下是一个二分类混淆矩阵

有一个好记的方法，正正负负为正确，正负为错误。我们来举个例子理解以下：
我们要预测一条文本内容是不是回答微信手机号，如果是则为正例，如果不是则为负例。假设我有两万条的测试样本，其中1.8万不是回答微信手机号，其中2000条是回答微信手机号。
使用训练好的模型对这2万条测试数据进行预测，得到1.75万条不是回答微信手机号，只有2500条是回答微信手机号。
在这里插入图片描述
那么根据上图我们可以得到以下指标

这里的F1Score由精度（P）和召回率（R）计算得到
通常精度和召回率是相互对抗的，即精度高，召回率低；精度低，召回率高
有的情况，在业务中没有明确说以精度或召回率为单指标判断模型质量，便可以使用F1Score的值或者上图两平衡点区间做一个评判标准（这里查准率就是精度，查全率就是召回率）
AUC-ROC
在这里插入图片描述
回归的评估指标
绝对误差MAE（mean absolute error）
预测点与真实点之间距离差的绝对值的均值
均方误差MSE（mean squared error）
预测点与实际点之间距离差的平方和的均值
聚类的评估指标

了解下就好

过于真实呢

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
2-9 模型评估指标

我们要预测一条文本内容是不是回答微信手机号，如果是则为正例，如果不是则为负例。假设我有两万条的测试样本，其中1.8万不是回答微信手机号，其中2000条是回答微信手机号。有的情况，在业务中没有明确说以精度或召回率为单指标判断模型质量，便可以使用F1Score的值或者上图两平衡点区间做一个评判标准（这里查准率就是精度，查全率就是召回率）使用训练好的模型对这2万条测试数据进行预测，得到1.75万条不是回答微信手机号，只有2500条是回答微信手机号。通常精度和召回率是相互对抗的，即精度高，召回率低；
复制链接

扫一扫

专栏目录

过于真实呢

CSDN认证博客专家 CSDN认证企业博客

码龄3年

广东药科大学

36: 原创

33万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

808: 积分

293: 粉丝

420: 获赞

15: 评论

279: 收藏

私信

关注

热门文章

分类专栏

jj的ai之路 32篇
jj的微信小程序学习笔记 3篇

最新评论

三万字带你一遍跑通uer
过于真实呢: 文章末尾的疑问，还望大佬指教
NLP+LLM从入门到精通系列
过于真实呢: 不好意思，我这个链接应该贴错了，下午我改一下，非常抱歉
NLP+LLM从入门到精通系列
2401_86097039: 你好，我点这个链接进不去怎么回事
搭建自己的ai客服
我叫浪浪吖: 官方文档写了个：有一个名为 score 的辅助变量，则在将分数更新 1 的代码步骤中，只需编写： score = score + 1;跟这个项目不搭呀，能否告知，有偿
搭建自己的ai客服
过于真实呢: 你可以看看官方帮助文档，翻译一下，这里比划不清楚

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

过于真实呢 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。