![339d01a5a723f7ab304396309b0fd6f7.png](https://i-blog.csdnimg.cn/blog_migrate/d9e2045393e6cb734b5cca31424a7e10.png)
今天,我为大家介绍下如何使用ALBERT和TextCNN来做文本分类。另外,文章结尾有Github项目链接。
一、介绍
1、此项目是在tensorflow版本1.14.0的基础上做的训练和测试。
2、NLP任务类型为中文文本情感分析,类型为文本多分类,一共3个标签:1、0、-1,分别表示正面、中面和负面的情感。
二、代码解释
1、为什么要使用ALBERT预训练语言模型呢?
首先,ALBERT论文解释了主要的4个改进点:
- Factorized embedding parameterization:嵌入向量参数化的因式分解
- Cross-layer parameter sharing:跨层参数共享
- Inter-sentence coherence loss:句间连贯性损失采用SOP
- Removing dropout:去除dropout
感兴趣的同学,建议看下论文:
https://arxiv.org/abs/1909.1194arxiv.org其次,模型较小,部署成本较低。尤其在生产环境进行部署时,会节约很多成本。
2、如何拼接ALBERT和TextCNN?
看过ALBERT项目的同学应该知道,在这个项目中已经提供了文本分类的