NLP
文章平均质量分 78
NLP
道巅
知黑守白,行道之巅。
码农5年,全栈,架构设计,技术管理,知识图谱,挖掘平台,大数据开发,Java开发,微服务,机器学习,深度学习,图深度学习
展开
-
NLP入门概览(9) ——句法分析c:局部句法分析、依存关系分析
在上一部分中,我们介绍了基于规则法、概率统计法、神经网络法的完全句法分析方法(NLP入门概览(8)——句法分析b:完全句法分析)。 在这一部分中,我们将介绍句法分析中的另外两种类型:局部句法分析、依存关系分析。1.局部句法分析 相比于完全句法分析要求对整个句子构建句法分析树,局部句法分析(浅层句法分析、语块分析)仅要求识别句子中某些结构相对简单的独立成分,如非递归的名词短语、动词短语等。这些识别出来的结构通常被称作语块(chunk),语块和短语这两个概念可以换用。 例如: 由此可见,转载 2020-10-21 14:36:39 · 3993 阅读 · 0 评论 -
NLP入门概览(8) ——句法分析b:完全句法分析
在上一部分中,我们简单介绍了完全句法分析的概念,并详细介绍了句法分析的基础:Chomsky形式文法(NLP入门概览(7) ——句法分析a:Chomsky(乔姆斯基)形式文法)。 在这一部分中,我们将对完全句法分析进行详细介绍。 回顾一下,句法分析共有三种类型:完全句法分析、局部句法分析、依存关系分析。 对于完全句法分析,还是NLP领域中常用的三种解决方法:规则法、概率统计法、神经网络方法。 下面我们从这三个方法入手,对完全句法分析算法进行介绍。1.规则句法分析算法 从上述句法分析树转载 2020-10-21 11:43:55 · 3379 阅读 · 0 评论 -
NLP入门概览(7) ——句法分析a:Chomsky(乔姆斯基)形式文法
在上一部分中,我们介绍了NLP领域最基本的问题:词法分析,现阶段解决该问题最常用的方法就是将其转化为序列标注问题,根据解决序列标注问题的方法对其进行解决。 词的问题解决了,那么下一步,就是句法分析。 在这一部分中,我们介绍完全句法分析的基础——Chomsky形式文法。 句法分析的任务是确定句子的句法结构或句子中词汇之间的依存关系,主要包括三种:完全句法分析、局部句法分析、依存关系分析。 其中,前两种句法分析是对句子的句法结构进行分析(也称为短语结构分析),而后一种是对句子中词汇间的依存关转载 2020-10-21 11:07:48 · 6160 阅读 · 0 评论 -
NLP入门概览(6) ——词法分析
在上一部分中,我们介绍了NLP领域中的一个基本问题:序列标注问题,并对解决该问题的三种方法:HMM、CRF、RNN+CRF进行了介绍。在这一部分中,我们将在语言结构层面对词法分析进行介绍。 在了解了NLP架构之后,一定还记得这样一张图: 现在,我们已经了解了自然语言研究层面的基本概念:语言模型、序列标注,下一步就是对“词”的分析和处理。 还是那句话,规则法、概率统计法、深度学习...转载 2020-02-11 19:54:16 · 17723 阅读 · 0 评论 -
NLP入门概览(5)—— 序列标注b:条件随机场(CRF)、RNN+CRF
了解了HMM之后,我们可以发现HMM有两个很明显的缺点:HMM定义的是联合概率,必须列举出所有可能出现的情况,这在很多领域是很困难的。在NLP领域,常知道各种各样但又不完全确定的信息,需要一个统一的模型将这些信息综合起来。HMM遵循一个假设:输出独立性假设。这要求序列数据严格相互独立才能保证推导的正确性,导致不能考虑上下文特征。而在NLP领域,上下文信息是很重要的。 因此,引入条件随...转载 2020-02-10 23:01:53 · 15557 阅读 · 0 评论 -
NLP入门概览(4)—— 序列标注a:隐马尔科夫模型(HMM)
在这一部分中,我们将要介绍NLP领域最常见的一类问题:序列标注。1. 序列标注 在NLP领域中,有许多的任务可以转化为“将输入的语言序列转化为标注序列”来解决问题。比如,命名实体识别、词性标注等等。1.1 命名实体识别 命名实体识别是NLP中的一个经典问题,比如从一句话中识别出人名、地名、组织机构名等等。 举例来看: 任务目标:将给定的输入序列中的组织机构名识别出来。 ...转载 2020-02-06 11:41:06 · 15527 阅读 · 0 评论 -
NLP入门概览(3)—— 神经网络语言模型、词向量
在这一部分中,我们将在此基础上介绍神经网络语言模型以及词向量的相关知识。在介绍这些知识之前,我们首先对自然语言处理领域的整体架构进行一些简单的介绍。1. 自然语言处理架构 首先,我们来看这样一张图。 从这张图中,可以清晰地看到,所谓的规则法、概率统计法、深度学习法都只是处理各类NLP问题的具体方法,而不是NLP问题的组成部分。(这一点一定要清晰,NLP不只是深度学习,深度学习仅仅是...转载 2020-02-05 18:30:11 · 15921 阅读 · 0 评论 -
NLP入门概览(2)——统计语言模型、语料库
1. 语言模型 在这一部分中,我们讨论的语言模型主要是统计语言模型,除此之外,我们在今后的文章中还会对神经网络语言模型进行介绍。 所谓语言模型,就是利用数学的方法描述语言规律。而统计语言模型,就是用句子S出现的概率P(S)来刻画句子的合理性(而不进行语言学分析处理),这是统计自然语言处理的基础模型。 假设句子S=w1,w2,…,wn,其中,wi可以暂时看作句子中的第i个词(在后面会进行...转载 2020-02-05 10:53:45 · 15310 阅读 · 0 评论 -
NLP入门概览(1)——概述
1. 什么是自然语言处理 个人认为,自然语言处理(Natural language processing,NLP)是将自然语言处理为计算机所能理解的东西,并利用计算机做一些进一步的处理以达到某些目的的方法。 那么问题来了,自然语言是什么? 自然语言,指人们平时用于交流的语言,例如英语、法语、汉语等等,也包括手语、旗语等,其标准定义为:人类社会发展过程中自然产生的、约定俗成的人类语言。...转载 2020-02-03 17:41:03 · 14951 阅读 · 0 评论