NLP模型常见报错(定期更新)

最新推荐文章于 2024-02-20 17:36:48 发布

风也温柔☆

最新推荐文章于 2024-02-20 17:36:48 发布

阅读量807

点赞数

分类专栏： debug 文章标签： nlp debug

本文链接：https://blog.csdn.net/qq_45432276/article/details/127593487

版权

debug 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本人是做NLP研究方向，在写代码跑模型的时候，会遇到一些bug。总有一些bug让我苦不堪言，痛苦不堪，绞尽脑汁。为此，我将把一些遇到的bug记录下来，方便他人和自己。
定期更新哟！！！
1、BiLSTM模型，跑阿里天池新闻分类比赛

训练模型第一轮epoch=1时：

准确率accuracy，损失值loss，f1_score得分，还挺正常。

但是，从训练模型第二轮即epoch=2开始：

准确率accuracy变得很小且不再大幅度改变
损失值loss变得很大且不再大幅度改变
f1_score得分变得很小且不再大幅度改变

在这里插入图片描述

  def __getitem__(self, index):
        # train_text是一个列表，列表里面的元素仍然是列表，且列表元素是一个个分词完毕的句子，
        # eg: [ ['I','love','you','too',...], [...], [...], ... ]
        text = self.train_text[index][:]
        # train_text[index]     表示取索引为index的元素即['I','love','you','too',...]
        # 接着要将其转换成数字(word_to_num)比如['5','2','1','11',...]，修改的是列表元素train_text[index]本身，相当于修改列表元素本身

        # train_text[index][:]  表示取索引为index的元素里面的所有内容即 ('I','love','you','too',...) 并将其赋值给text
        # 接着要将其转换成数字(word_to_num)比如('5','2','1','11',...)，修改的是text,相当于修改副本

        # 因此，在epoch=1时，准确率accuracy，损失值loss，f1_score得分，还挺正常。
        # 但是，从第二轮即epoch=2开始，准确率accuracy变得很小且不再大幅度改变，损失值loss变得很大且不再大幅度改变，f1_score得分变得很小且不再大幅度改变,
        label = self.train_data_label[index]