准确率(accuracy)、精确率(Precision)、召回率(Recall)

准确率(accuracy),精确率(Precision)和召回率(Recall)是信息检索,人工智能,和搜索引擎的设计中很重要的几个概念和指标。中文中这几个评价指标翻译各有不同,所以一般情况下推荐使用英文。

概念介绍
   

先假定一个具体场景作为例子。

假如某个班级有男生80人,女生20人,共计100人.目标是找出所有女生.

  某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了.

  作为评估者的你需要来评估(evaluation)下他的工作


      首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。也就是损失函数是0-1损失时测试数据集上的准确率.


       这样说听起来有点抽象,简单说就是,前面的场景中,实际情况是那个班级有男的和女的两类,某人(也就是定义中所说的分类器)他又把班级中的人分为男女两类。accuracy需要得到的是此君分正确的人占总人数的比例。很容易,我们可以得到:他把其中70(20女+50男)人判定正确了,而总人数是100人,所以它的accuracy就是70 %(70 / 100).


      由准确率,我们的确可以在一些场合,从某种意义上得到一个分类器是否有效,但它并不总是能有效的评价一个分类器的工作。举个例子,google抓取了argcv 100个页面,而它索引中共有10,000,000个页面,随机抽一个页面,分类下,这是不是argcv的页面呢?如果以accuracy来判断我的工作,那我会把所有的页面都判断为"不是argcv的页面",因为我这样效率非常高(return false,一句话),而accuracy已经到了99.999%(9,999,900/10,000,000),完爆其它很多分类器辛辛苦苦算的值,而我这个算法显然不是需求期待的,那怎么解决呢?这就是precision,recall和f1-measure出场的时间了.


        在说precision,recall和f1-measure之前,我们需要先需要定义TP,FN,FP,TN四种分类情况.


          按照前面例子,我们需要从一个班级中的人中寻找所有女生,如果把这个任务当成一个分类器的话,那么女生就是我们需要的,而男生不是,所以我们称女生为"正类",而男生为"负类".

 相关(Relevant),正类无关(NonRelevant),负类
被检索到(Retrieved)true positives(TP 正类判定为正类,例子中就是正确的判定"这位是女生")false positives(FP 负类判定为正类,"存伪",例子中就是分明是男生却判断为女生,当下伪娘横行,这个错常有人犯)
未被检索到(Not Retrieved)false negatives(FN 正类判定为负类,"去真",例子中就是,分明是女生,这哥们却判断为男生--梁山伯同学犯的错就是这个)true negatives(TN 负类判定为负类,也就是一个男生被判断为男生,像我这样的纯爷们一准儿就会在此处)

通过这张表,我们可以很容易得到例子中这几个分类的值:TP=20,FP=30,FN=0,TN=50.
 





精确率”与“召回率”的关系



       “精确率”与“召回率”虽然没有必然的关系(从上面公式中可以看到),然而在大规模数据集合中,这两个指标却是相互制约的。
 
        由于“检索策略”并不完美,希望更多相关的文档被检索到时,放宽“检索策略”时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
 
        而希望去除检索结果中的不相关文档时,务必要将“检索策略”定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响。
 
        凡是涉及到大规模数据集合的检索和选取,都涉及到“召回率”和“精确率”这两个指标。而由于两个指标相互制约,我们通常也会根据需要为“检索策略”选择一个合适的度,不能太严格也不能太松,寻求在召回率和精确率中间的一个平衡点。这个平衡点由具体需求决定。

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
【资源说明】 基于Keras+BERT模型编写的情感分析python源码+超详细注释+项目使用说明+情感数据集.zip 我的计算设备是笔记本上的 GTX 1060 6G,算力较低,训练较为耗时,所以只训练了一个epoch(在我的设备上约花费1个小时),并且取得了还不错的效果。 如下是训练1个epoch的模型性能参数: 数据集|准确率(Accuracy)|精确率(Precision)|召回率(Recall)|F1 Score --|--|--|--|-- 训练集|0.9635|0.9705|0.9565|0.9608 开发集(验证集)|0.9773|0.9913|0.9637|0.9755 测试集|0.9781|0.9915|0.9658|0.9770 数据集划分比例为: 数据集|比例 --|-- 训练集|0.75 开发集|0.15 验证集|0.15 模型训练完成后,可以自行输入语句进行情绪倾向判断,如: ``` 请输入一句话,模型将判断其情绪倾向:虽然没有买到想要的东西,但我并不沮丧 正面情绪! 请输入一句话,模型将判断其情绪倾向:没有买到想要的东西, 有点沮丧 负面情绪! 请输入一句话,模型将判断其情绪倾向:书挺好的,就是贵了点 正面情绪! 请输入一句话,模型将判断其情绪倾向:书的确不错,但也太贵了 负面情绪! ``` 安装依赖环境。 - 在`settings.py`中配置好相关路径,并根据个人情况配置好其他参数。 - 在`keras-bert-emotional-classifier`路径下,执行命令`python train.py`。 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
【资源说明】 基于TensorFlow 2.0和循环神经网络开发的情感分析python源码+使用说明+超详细注释.zip 我的计算设备是笔记本上的 GTX 1060 6G,当选择batch size=32时,训练完一个epoch耗时约125s。 如下是训练4个epoch的模型性能参数: 数据集|准确率(Accuracy)|精确率(Precision)|召回率(Recall)|F1 Score --|--|--|--|-- 训练集|0.9759|0.9904|0.9610|0.9746 开发集(验证集)|0.9732|0.9858|0.9605|0.9722 测试集|0.9753|0.9866|0.9634|0.9740 数据集划分比例为: 数据集|比例 --|-- 训练集|0.75 开发集|0.15 验证集|0.15 # 快速开始 我的Python环境是Linux下使用Anaconda安装的,所以请根据自己的实际情况,自行判断是否需要将下面命令中的python和pip替换成python3和pip3。 ## 1.如何训练模型? - clone项目到本地。 - 下载数据集。 - 在`tf2-rnn-emotional-classifier`路径下,执行命令`pip install -r requirements.txt` - 在`settings.py`中配置好相关路径,并根据个人情况配置好其他参数。 - 在`tf2-rnn-emotional-classifier`路径下,执行命令`python train.py`。 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明 YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明YOLO高分设计资源源码,详情请查看资源内容中使用说明

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值