深度学习-自然语言-文本分类模型

m0_71624701

于 2023-10-25 14:17:02 发布

阅读量63

点赞数

文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/m0_71624701/article/details/134033693

版权

本文介绍了多种基于深度学习的文本分类模型，包括fastText、TextCNN、CharCNN、Bi-LSTM、Bi-LSTM+Attention、RCNN、Adversarial LSTM、Transformer、ELMO和BERT。这些模型利用预训练技术如word2vec和预训练模型如ELMO、BERT来提升文本分类效果，展示了深度学习在自然语言处理领域的广泛应用。

摘要由CSDN通过智能技术生成

文本分类
包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMO，BERT等）的文本分类

fastText 模型
textCNN 模型
charCNN 模型
Bi-LSTM 模型
Bi-LSTM + Attention 模型
RCNN 模型
Adversarial LSTM 模型
Transformer 模型
ELMO 预训练模型
BERT 预训练模型
一 fastText 模型
fastText模型架构和word2vec中的CBOW很相似，不同之处是fastText预测标签而CBOW预测的是中间词，即模型架构类似但是模型的任务不同。

其中x1,x2,...,xN−1,xN表示一个文本中的n-gram向量，每个特征是词向量的平均值。这和前文中提到的cbow相似，cbow用上下文去预测中心词，而此处用全部的n-gram去预测指定类别。

import torch.nn as nn
import torch.nn.functional as F

class FastText(nn.Module):
def __init__(self, vocab_size, embedding_dim, output_dim, pad_idx):

super().__init__()

self.embedding = nn.Embedding(vocab_size, embedding_dim, padding_idx=pad_idx)

self.fc = nn.Linear(embedding_dim, output_dim)

def forward(self, text):

#text = [sent len, batch size]

embedded = self.embedding(text)

#embedded = [sent len, batch size, emb dim]

embedded = embedded.permute(1, 0, 2)

#embedded = [batch size, sent len, emb dim]

pooled = F.avg_pool2d(embedded, (embedded.shape[1], 1)).squeeze(1)

#pooled = [batch size, embedding_dim]

return self.fc(pooled)

二 TextCNN模型
TextCNN 是利用卷积神经网络对文本进行分类的算法，由 Yoon Kim 在 “Convolutional Neural Networks for Sentence Classification” 一文中提出. 是2014年的算法.

将Text的词向量拼接在一起,就好比一张图,只不过这个图只是一个channel的.这里使用的就是Conv1d.

模型的结构是:

Embedding layer
Convolutional layer:可以用不同尺度的filter产生多个feature map
MaxPooling Layer
Feedfoward layer
Softmax Layer

class CNN1d(nn.Module):
def __init__(self, vocab_size, embedding_dim, n_filters, filter_sizes, output_dim,
dropout, pad_idx):

super().__init__()

self.embedding = nn.Embedding(vocab_size, embedding_dim, padding_idx = pad_idx)

self.convs = nn.ModuleList([
nn.Conv1d(in_channels = embedding_dim,
out_channels = n_filters,
kernel_size = fs)
for fs in filter_sizes
])

self.fc = nn.Linear(len(filter_sizes) * n_filters, output_dim)

self.dropout = nn.Dropout(dropout)

def forward(self, text):

#text = [sent len, batch size]

text = text.permute(1, 0)

#text = [batch size, sent len]

embedded = self.embedding(text)

#embedded = [batch size, sent len, emb dim]

embedded = embedded.permute(0, 2, 1)

#embedded = [batch size, emb dim, sent len]

conved = [F.relu(conv(embedded)) for conv in self.convs]

#conved_n = [batch size, n_filters, sent len - filter_sizes[n] + 1]

pooled = [F.max_pool1d(conv, conv.shape[2]).squeeze(2) for