NLP知识整理(下)

最新推荐文章于 2024-04-24 17:29:50 发布

sad4luv

最新推荐文章于 2024-04-24 17:29:50 发布

阅读量412

点赞数

分类专栏： NLP 文章标签： NLP

本文链接：https://blog.csdn.net/qq_26413541/article/details/85998511

版权

本文深入探讨了NLP领域的机器学习和深度学习模型，重点讲解了LSTM的工作原理，包括普通RNN结构、遗忘门、更新门、细胞状态和输出门。此外，还介绍了TextCNN的构建，包括嵌入层、卷积层、池化层、拼接层和全连接层。FastText和朴素贝叶斯模型也进行了简要概述。

摘要由CSDN通过智能技术生成

在完成特征抽取后，我们就将文本型数据转化成了规范的数字格式数据，可以送入机器学习模型或深度学习模型进行训练了。如果采用机器学习的方式，比较适合的模型有LR，LinearSVC, NaiveBayse,如果向量的维度不是很高很稀疏，一些树类模型如RandomForest, Xgboost, LightGBM也可以对其进行训练。

随着近些年深度学习的发展，在计算力和数据量足够的条件下，深度学习越来越能发挥其深层特征抽取的能力，获得更好的预测效果和泛化效果。常见的模型有MLP, TextCNN, TextRNN, TextRCNN, LSTM, GRU, FastText,Bert… 这里以TextCNN举例讲解一个深度学习模型的构建

LSTM

遗忘门由上层输出和本轮输入共同决定，决定的方式是sigmoid输出一个0-1的值(这个值往往可以看做是非0即1的)，当这个值f为0时，之前的状态C(t-1)与之点乘变成0，之前的状态便被遗忘，反之之前的状态与1点乘，原始信息得以保留。

遗忘门是对之前的信息做一个过滤，来确定遗忘还是记住之前的信息状态C(t-1)
除此之外，我们还要对当前输入信息X(t)做一个过滤，这就是更新门的作用
更新门由两部分i(t)和C_{(t-1)组成，这两部分都由上轮输出h(t-1)和本轮输出x(t)共同决定,i(t)的作用是用一个sigmoid函数产生一个近似}

关注

专栏目录