公式识别项目汇总

1、样本类别不均衡问题

(1)统计每个token的频数

(2)采用数据增强策略、数据合成方法 缓解 样本类别不均衡问题

  (3)   focal loss 缓解 长尾数据分布

长尾分布数据_拔牙的萌萌鼠的博客-CSDN博客_长尾数据

长尾数据分类(待更新帖) - 知乎

2、评价指标

Eval: BLEU-4 91.51 - EM 78.00 - Edit 94.42 - perplexity -1.16
BLEU-4 92.80 - EM 90.00 - Edit 95.41 - perplexity -1.19

BLEU-4 92.80

https://zhuanlan.zhihu.com/p/223048748
https://zhuanlan.zhihu.com/p/449091199
https://zhuanlan.zhihu.com/p/381123453

机器翻译评价指标 — BLEU算法 - 微笑sun - 博客园

BLEU指标是NLP中机器翻译中常用的评价指标,是基于精确率来设计的,BLEU-4就是基于4-gram来设计的,常见的还有BLEU-1、BLEU-2、BLEU-3,数字越大,对模型的评价越苛刻。

例如: string1为 123456789、string2为 123556799,BLEU-4=0

EM 90.00 

上代码,精准匹配,评价的是整条的准确率,即:如果预测序列和标签序列完全相同,则为True,否则为False.

def exact_match_score(references, hypotheses):
    """Computes exact match scores.

    Args:
        references: list of list of tokens (one ref)
        hypotheses: list of list of tokens (one hypothesis)

    Returns:
        exact_match: (float) 1 is perfect

    """
    exact_match = 0
    for ref, hypo in zip(references, hypotheses):
        if np.array_equal(ref, hypo):
            exact_match += 1

    return exact_match / float(max(len(hypotheses), 1))

Edit 95.41

perplexity -1.19

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值