weixin_42003117-CSDN博客

原创基于深度学习的自然语言处理第八章

从文本特征到输入8.1 编码分类特征处理自然语言时用到的大部分特征是离散的、分类的特征，比如单词、字母和词性。我们将讨论独热编码和稠密向量两种方案，以及两种方案的权衡和关系。8.1.1 独特编码在形如f(x)=xW+b的线性模型和对数线性模型中，很容易想到指示函数，每个可能的特征都用单独一维表示。举例来说，当用词袋模型表示包含40000项的词表时，x将会是一个40000维的向量，其中第23227维对应单词dog，第12425维对应单词cat。一篇包含20个词的文档将由非常稀疏的40000维向量表示，

2022-03-26 13:33:47 1753

原创基于深度学习的自然语言处理第七章

基于深度学习的自然语言处理第七章NLP特征的案例分析在讨论了用于从自然语言中获取特征的不同信息来源后，我们继续探讨具体的NLP分类任务实例，以及适合它们的特征。7.1 文本分类：语言识别在语言识别任务中，给定一个文档或句子，希望判别是哪一种语言。正如第二章看到的，字母级二元文法词袋(bag of letter-bigrams)是这个任务的一个非常强的特征表示。具体来说，每一个二阶字母是一个核心特征，对于给定的文档，其核心特征是该特征在文档中的计数。7.2 主题分类在主题分类任务中，对于给定的文

2022-03-23 19:46:22 966

原创基于深度学习的自然语言处理第六章

文本特征构造在前一章中，我们讨论了通用的学习问题，并且看到了一些适用于训练这些问题的机器学习模型和算法。这些模型都将x视为输入向量，之后进行预测。迄今为止，我们假设向量x是已知的。在语言处理中，向量x来源于文本数据，能够反映文本数据所具有的多种语言学特性。这种从文本数据到具体向量的映射称为特征提取和特征表示，通过特征方程所完成。决定正确的特征是使一个机器学习项目取得成功的一部分。深度神经网络减轻了对特征工程的需要，当然，核心特征还是要被定义的。尤其是对语言数据，其以一系列离散的符号形式存在。这个序列需要使

2022-03-20 21:34:25 2507

原创基于深度学习的自然语言处理复习笔记第五章

神经网络训练与线性模型类似，神经网络也是可微分的参数化函数，它使用了基于梯度的优化算法来进行训练。非线性神经网络的目标函数并不是凸函数，因此使用基于梯度的优化方法可能会陷入局部极小。但是，基于梯度的优化方法在实际应用中仍然取得了良好的效果。梯度计算是神经网络训练的核心。神经网络梯度计算的数学原理与线性模型，都是简单地利用微分地链式法则来进行计算。但是，对于复杂地网络来说，这个过程可能比较费力并且容易出错。幸运的是，梯度能够通过反向传播算法被有效和自动地计算得出。反向传播算法是一种使用链式法则来计算复杂式

2022-03-02 09:10:38 433

原创基于深度学习的自然语言处理复习笔记第四章

第四章前馈神经网络4.1 一个关于大脑的比喻在比喻中，神经元是具有标量输入和输出的计算单元。每个输入都有与其相关联的权重。神经元将每个输入乘其权重并将它们相加，然后使其通过一个非线性函数，最终传递给其输出。神经元彼此连接，形成网络：神经元的输出可能会提供给一个或者多个神经元作为输入。这样的网络被证明是功能强大的计算工具。如果权重设置正确，具有足够多神经元和非线性激活函数的神经网络可以近似模拟种类非常广泛的数学函数。经典的前馈神经网络如图4.2所示。图中，圆圈代表神经元，指向神经元的箭头代表其输入，

2022-02-28 09:49:55 931

weixin_42003117的博客

原创基于深度学习的自然语言处理第八章

原创基于深度学习的自然语言处理第七章

原创基于深度学习的自然语言处理第六章

原创基于深度学习的自然语言处理复习笔记第五章

原创基于深度学习的自然语言处理复习笔记第四章

原创基于深度学习的自然语言处理笔记第三章

原创基于深度学习的自然语言处理笔记

原创 2021-09-15

空空如也

空空如也