BERT+BiLSTM+CRF预测值全是同一个标签问题(即预测为0)

        记录一下困扰了我几乎五天的问题,最近手撸了一个BERT+BiLSTM+CRF的代码,在构建之时最难的就是train和dataload,model模块基本都有现成的很快就写好了。但之后却出现了一个问题,我使用的数据集是huggingface的weibo_ner_knowledge_V3_wc数据集,其中用于标识无关内容的标签16占了多数。果不其然,跑了好几次,每次模型最后都只会预测标签16,其他标签都不会预测,给人感觉是模型觉得只预测16便能得到很高的准确率所以它只预测16。

        但你这耍我呢,我肯定要你预测其他标签呀,所以这几天疯狂检查,model和dataload基本都重置了一次问题依旧存在。(但这里也要注意,使用了huggingface的berttokenizer处理文本时返回内容会自动添加起始符和结束符标签,那label也要做相应的处理标识出起始符和结束符)搞了那么多天无用功,结果今天我不小心把batch_size和学习率调小了居然跑通了,它居然能基本正确预测出实体标签了。就现在而言我只能认为是这个数据集中含有很多标签16,甚至有些样例全是16,导致模型学习时出现了问题。所以现在把我的解决方案放在这里,希望能和广大网友探讨下这个问题。

        源码发布在gitee:https://gitee.com/sky-zhu-chang/bert_lstm_crf.git

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值