bert仅仅基于attention,没有考虑词性、对上下文信息也仅仅用了embedding,仅仅用语义信息,会出现错判。Bert对各个词的权重是一样的,不能突出关键词。bert对整句话只抽取一个主旨,像‘我做了头发,我还能买新衣服’这样的句子,就判断不出来了。
在训练中,融入词性、句法信息、停用词,抽取多个主旨,以改善这个现象
基于中文问答系统谈Bert的不足及改进
最新推荐文章于 2024-05-28 16:42:32 发布
bert仅仅基于attention,没有考虑词性、对上下文信息也仅仅用了embedding,仅仅用语义信息,会出现错判。Bert对各个词的权重是一样的,不能突出关键词。bert对整句话只抽取一个主旨,像‘我做了头发,我还能买新衣服’这样的句子,就判断不出来了。
在训练中,融入词性、句法信息、停用词,抽取多个主旨,以改善这个现象