NER模型问题记录

BERT+BILSTM+CRF组合模型

在抽取时间实体时出现了模型“死记硬背”的情况,由于构造数据集主要采用近几年的文本内容,故时间跨度太小且大部分都是2021年和2022年的数据,去年模型对时间的抽取还很很好,基本可以达到百分百的准确率,但在抽取最近的数据时,频繁的出现错误,经过多次对比验证,发现是模型对于“2023年”这个内容总是抽取错误,又由于是序列模型,所以后面的识别结果也会受到影响。

分析原因是模型频繁的学习2021和2022,缺少其他年份信息,导致模型认为只有这两个年份才属于时间。后续需要对时间进行跨度上的调整,重新训练模型

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值