Bert-Chinese-Text-Classification-Pytorch-master指标学习(自用待补充)

本文介绍了模型评估中的关键指标,如混淆矩阵、精确率、召回率和F1分数,并探讨了预训练词向量与分词器匹配的重要性。在面对数据噪声时,提出了应对策略,包括选择合适的模型输入粒度和处理错误标注。此外,还讨论了在类别不均衡问题上的处理方法和模型调参技巧。
摘要由CSDN通过智能技术生成

Bert-Chinese-Text-Classification-Pytorch-master指标学习

指标学习

混淆矩阵(Confusion Matrix)

  • 在n分类模型中,使用n行n列的矩阵形式来表示精度,纵列代表n个分类,在每行中的n个数据代表分别预测在每个类别的个数,完美的预测应该是一个列序数=行中有数据的索引数的一条斜线。
预测成正例 预测成反例 加和含义 统计量
正例 TP FN TP+FN表示实际数据集中正样本的数量 召回率TPR=TP/(TP+FN)
反例 FP TN FP+TN表示实际数据集中负样本的数量 召回率FPR =FP/(FP+TN)
加和含义 TP+FP表示预测为正类样本数 FN+TN表示预测的负类样本数
统计量 精确率=TP/(TP+FP) 正确率=(TP+TN)/(TP+TN+FP
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值