自然语言处理
文章平均质量分 79
泛小凡
自然语言处理 数据分析 金融 知识图谱
展开
-
NLP基础知识(三)-AI应用篇
文本间的推理关系,又称为文本蕴含关系 (TextualEntailment),作为一种基本的文本间语义联系,广泛存在于自然语言文本中。简单的来说文本蕴含关系描述的是两个文本之间的推理关系,其中一个文本作为前提(premise),另一个文本作为假设(hypothesis),如果根据前提P能够推理得出假设H,那么就说P蕴含H。这跟一阶逻辑中的蕴含关系是类似的。如果能从前提句(premise)能推...原创 2020-02-25 14:56:03 · 1284 阅读 · 0 评论 -
NLP基础知识(二)
谓语论元 谓语动词决定了一个分句的基本格局,谓语动词一旦确定,整个分句的基本格局也就确定下来了。谓语动词需要一个、两个或三个名词性结构(这个结构可能是短语层面的,也可能是分句层面的)与其结合来表达完整的意思,有人称这个是动词的论元结构,也就是一个动词可以有一个、两个或是三个论元。谓语动词基本上表达了分句的主要含义,我们在进行表达时最先想到的应该就是动词部分,我们只要确定了谓语动词,然后再根...原创 2020-02-24 17:38:06 · 585 阅读 · 0 评论 -
NLP基础知识(一)
中文分词 (Word Segmentation, WS) 指的是将汉字序列切分成词序列。 因为在汉语中,词是承载语义的最基本的单元。分词是信息检索、文本分类、情感分析等多项中文自然语言处理任务的基础。词性标注(Part-of-speech Tagging, POS)是给句子中每个词一个词性类别的任务。 这里的词性类别可能是名词、动词、形容词或其他。下面的句子是一个词性标注的例子。 其中,...原创 2020-02-24 16:42:15 · 1311 阅读 · 0 评论 -
事件抽取与事理图谱(二)
事理图谱,顾名思义,是以事件为节点,事件间的关系为边的图谱网络。与知识图谱中实体及关系大多是稳定的不同,事理图谱中关系大多是不确定的,以一定的概率进行转移。人类的命题记忆是以“事件”为存储单位的,以事件作为知识的基本单元更能反映客观世界的知识。从认知心理学的角度来看,事件更符合人类的理解与思维习惯,事件关系到多方面的概念,是比概念粒度更大的知识单元。传统本体(知识图谱)所使用的概念模...原创 2020-01-22 17:10:54 · 1311 阅读 · 0 评论 -
事件抽取与事理图谱(一)
事件抽取是信息抽取研究中最具挑战性的任务之一,其主要研究如何从非结构化自然语言文本中抽取出事件的基本信息,例如事件的类型,事件的参与者,发生时间和地点等,并以结构化的形式呈现出来。一些信息抽取领域的国际评测会议针对事件抽取提出了一系列的理论,并推出了一些实用的系统框架:事件,作为信息的一种表现形式,其定义为特定的人、物在特定时间和特定地点相互作用的客观事实,一般来说是句子级的。组成...原创 2020-01-22 17:01:46 · 2132 阅读 · 0 评论