第三课---语言模型和文本分类

一、语言模型

是衡量一句话的合理性大小的一种表示。
在这里插入图片描述

链式法则

在做语言模型时,往往会遵从下面的一种法则,依据条件概率学,每后面的一个单词是基于前面的单词出现的概率。
在这里插入图片描述

马尔可夫假设

后面的单词往往只基于前面的n个单词,至于n+1,n+2个单词就忽略不计了。
在这里插入图片描述

语言模型的评价

在这里插入图片描述

基于神经网络的语言模型(Neural Language Model)

在这里插入图片描述

循环神经网络(Recurrent Neural Network)

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

训练RNN很难

在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述

长短记忆网络(Long Short-term Memory)

在这里插入图片描述

RNN细胞

在这里插入图片描述

LSTM记忆细胞

在这里插入图片描述

长短记忆网络(Long Short-term Memory)

在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述在这里插入图片描述在这里插入图片描述

Gated Recurrent Unit

在这里插入图片描述

二、文本分类

在这里插入图片描述在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

双向RNN

在这里插入图片描述

堆叠循环神经网络

在这里插入图片描述
在这里插入图片描述

CNN用作文本分类

在这里插入图片描述

Embedding层

在这里插入图片描述

卷积层

在这里插入图片描述

Pooling层

在这里插入图片描述

Regularization

在这里插入图片描述

CNN实验结果

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
文本分类是自然语言处理中的一种任务,它的目的是将一篇长文本划分到一个或多个预定义的类别中。长文本分类的应用非常广泛,例如新闻分类、情感分析、垃圾邮件过滤等。 长文本分类的实现涉及以下几个步骤: 1. 数据预处理:这是长文本分类的第一步,需要对原始数据进行清洗,包括去除噪声、停用词、标点符号等,同时还需要将原始数据转换成数字矩阵形式,以便后续处理。 2. 特征提取:特征提取是长文本分类的关键步骤,它的目的是将文本转换成有意义的特征向量。常见的特征提取方法包括词袋模型、TF-IDF、word2vec等。其中,词袋模型是最常用的特征提取方法之一,它将每个文本看作一个词袋,统计每个词出现的频率,然后将文本转换成一个向量。 3. 模型选择:模型选择是长文本分类的关键环节之一。常用的模型包括朴素贝叶斯、支持向量机、决策树、深度学习模型等。近年来,深度学习模型在长文本分类任务中取得了很好的效果,其中常用的模型包括卷积神经网络、循环神经网络、Transformer等。 4. 模型训练和评估:模型训练和评估是长文本分类的最后一步。在训练过程中,需要使用标注好的数据对模型进行训练,同时需要使用验证集对模型进行调参,以达到最佳的性能。在评估过程中,需要使用测试集对模型进行评估,以了解其在实际应用中的表现。 总的来说,长文本分类是一个非常重要的自然语言处理任务,它的实现需要从数据预处理、特征提取、模型选择、模型训练和评估等多个方面进行综合考虑。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值