【深度学习】基于BERT模型的情感分析（附实战完整代码+数据集）

置顶

Yang-ai-cao

已于 2024-07-19 10:45:22 修改

阅读量2.5w

点赞数 102

分类专栏：深度学习 NLP 文章标签：深度学习 nlp bert python 机器学习多分类

于 2024-02-15 08:58:39 首次发布

本文链接：https://blog.csdn.net/aaaa_hsjsueu/article/details/136094167

版权

这篇博客详细介绍了BERT模型的结构、预训练任务，包括MLM和NSP，并提供了BERT模型在情感分析任务上的实现步骤，包括数据处理、模型微调、训练和保存模型。博主分享了完整的Python代码示例，适用于初学者实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

🌸个人主页：Yang-ai-cao

📕系列专栏：深度学习

🍍 博学而日参省乎己，知明而行无过矣

4.1 MLM（Masked Language Model）

4.2 NSP（Next Sentence Prediction）

7.3 转换为 DataFrame 并分割数据集

1.BERT介绍

BERT的全称为Bidirectional Encoder Representation from Transformers，是一个预训练的语言表征模型，它强调不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练。它旨在通过在所有层中对左右上下文进行联合调节，采用新的masked language model（MLM），用于语言理解的深度双向转换器的预训练，从未标记的文本中预训练深度双向表示。因此，只需一个额外的输出层即可对预训练的 BERT 模型进行微调，从而为各种任务（例如问答和语言推理）创建较为先进的模型，而无需对特定于任务的架构进行大量修改。

· BERT在 11 项自然语言处理任务上获得了最先进的新结果，包括将 GLUE 分数提高到 80.5% （绝对提高 7.7%），将 MultiNLI 准确率提高到 86.7%（绝对提高 4.6%），将 SQuAD v1.1 问答测试 F1 提高到 93.2（绝对提高 1.5 分），将 SQuAD v2.0 测试 F1 提高到 83.1（绝对提高5.1 分）。

· BERT的网络架构主要使用的是《Attention is all you need》中提出的多层Transformer结构，Transformer结构在NLP领域中已经得到了广泛应用，其最大的特点是抛弃了传统的RNN和CNN。通过Self-Attention机制将任意位置的两个单词的距离进行特定转换，有效的解决了NLP 中棘手的长期依赖问题。

2.BERT结构

BERT利用MLM进行预训练并且采用深层的双向Transformer组件进行构建模型，总体结构是将多个Transformer Encoder一层一层地堆叠起来。在论文中，作者分别用12层和24层Transformer Encoder组装出两套BERT模型，两套模型的参数总计分别为110M和340M。（Transformer模型详解（图解最完整版） - 知乎 (zhihu.com)）