公式识别项目汇总

King的王国

已于 2022-11-10 16:42:22 修改

阅读量138

点赞数

分类专栏：深度学习文章标签：深度学习

于 2022-09-27 16:24:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28057379/article/details/127073413

版权

深度学习专栏收录该内容

44 篇文章 1 订阅

订阅专栏

1、样本类别不均衡问题

（1）统计每个token的频数

（2）采用数据增强策略、数据合成方法缓解样本类别不均衡问题

(3) focal loss 缓解长尾数据分布

长尾分布数据_拔牙的萌萌鼠的博客-CSDN博客_长尾数据

长尾数据分类(待更新帖) - 知乎

2、评价指标

Eval: BLEU-4 91.51 - EM 78.00 - Edit 94.42 - perplexity -1.16
BLEU-4 92.80 - EM 90.00 - Edit 95.41 - perplexity -1.19

BLEU-4 92.80

https://zhuanlan.zhihu.com/p/223048748
https://zhuanlan.zhihu.com/p/449091199
https://zhuanlan.zhihu.com/p/381123453

机器翻译评价指标 — BLEU算法 - 微笑sun - 博客园

BLEU指标是NLP中机器翻译中常用的评价指标，是基于精确率来设计的，BLEU-4就是基于4-gram来设计的，常见的还有BLEU-1、BLEU-2、BLEU-3，数字越大，对模型的评价越苛刻。

例如： string1为 123456789、string2为 123556799，BLEU-4=0

EM 90.00

上代码，精准匹配，评价的是整条的准确率，即：如果预测序列和标签序列完全相同，则为True，否则为False.

def exact_match_score(references, hypotheses):
    """Computes exact match scores.

    Args:
        references: list of list of tokens (one ref)
        hypotheses: list of list of tokens (one hypothesis)

    Returns:
        exact_match: (float) 1 is perfect

    """
    exact_match = 0
    for ref, hypo in zip(references, hypotheses):
        if np.array_equal(ref, hypo):
            exact_match += 1

    return exact_match / float(max(len(hypotheses), 1))

Edit 95.41

perplexity -1.19

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
公式识别项目汇总

项目汇总
复制链接

扫一扫

专栏目录

King的王国 CSDN认证博客专家 CSDN认证企业博客

码龄9年

132: 原创

5万+: 周排名

81万+: 总排名

18万+: 访问

: 等级

1770: 积分

288: 粉丝

125: 获赞

39: 评论

531: 收藏

私信

关注

热门文章

分类专栏

LeetCode 11篇
OCR 1篇
目标检测 8篇
Python 34篇
深度学习 44篇
数据结构 5篇
文本检测 1篇
动态规划 1篇
PyTorch 8篇
NLP 1篇
图像处理 1篇
数学 2篇
机器学习 6篇
工程经验 2篇
目标分割 2篇
目标分类 1篇
Dokcer 1篇
文本识别 1篇
linux 10篇
tensorflow 2篇

最新评论

pytorch中DataLoader的num_workers参数详解与设置大小建议
夏晚秋丿: 不用，只不过要加一句 if __name__ == '__main__'
pytorch中DataLoader的num_workers参数详解与设置大小建议
扶光_43T: 请问在哪个文件夹设置
pytorch中DataLoader的num_workers参数详解与设置大小建议
快乐学习吧: 经过询问chatgpt的解释： 1. GPU是由CPU发送指令和数据来执行计算任务的。在GPU中，线程是由CPU分配的，并且从CPU获取它们需要处理的数据。GPU本身没有能力添加线程或获取数据，它只能按照CPU给定的指令和数据执行计算任务。因此，送数据是由CPU的主线程负责送的。 2.num_workers=0，CPU不分配额外线程，只有一个主线程，负责将数据送到RAM后再将数据送到GPU. 3.num_works=1时，CPU分配一个单独线程专门负责将数据送到RAM，主线程专门负责将数据送到GPU
numpy的二维数组的切片索引
XuXinCHN: 写的很全面！很棒
极简TensorFlow学习教程-----TensorFow中Tensor与Numpy相互转换
甘啊: 写的很好，谢谢啦

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。