![](https://img-blog.csdnimg.cn/fbfa7f631a3d4b3c8c8c1a222aee5ce4.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
《自然语言处理简明教程》读书笔记
文章平均质量分 78
自然语言处理
非文的NLP修炼笔记
研究生在读,NLP小白一枚,希望大家多多指教~
展开
-
《自然语言处理简明教程》读书笔记:第十四章 文本数据挖掘
自然语言的文本中蕴藏着大量丰富的信息,但是,自然语言却对这些信息进行了编码,把这些信息隐藏在文本当中,使它们成了一种难以解释的形式。可能正是因为这样的原因,在过去的自然语言处理中,很少有人去研究如何从文本中挖掘那些隐藏着的信息,大多数人要么是使用信息抽取的方法从数据中抽取信息,要么就是使用信息检索的方法直接从文本中检索信息。”文本数据挖掘“(Text Data Mining,简称TDM)目的在于从大规模真实文本的数据中发现或推出那些隐藏在文本中的信息,或者找出文本数据集合的模型,或者预测文本数据中所隐含的趋原创 2022-06-07 15:36:10 · 2792 阅读 · 1 评论 -
《自然语言处理简明教程》读书笔记:第二章 词汇自动处理
第二章 词汇自动处理第一节 词汇是语言的建筑材料近些年来,语料库证据支持的词汇学研究蓬勃发展,越来越多的实证研究表明,词汇和语法在实现意义时是交织一起的,必须整合描述。词汇是话语实现的主要载体,语法则起到管理意义、组合成份和构筑词项的作用。...原创 2022-03-28 10:09:29 · 2518 阅读 · 0 评论 -
《自然语言处理简明教程》读书笔记:第一章 自然语言处理与理论语言学
第一章 自然语言处理与理论语言学我们认为,计算机对自然语言的研究和处理,一般应经过如下四个方面的过程:第一,把需要研究的问题在语言学商加以形式化,建立语言的形式化模型,使之能以一定的数学形式,严密而规整地表示出来,这个过程可以叫做“形式化”;第二,把这种严密而规整的数学形式表示为算法,这个过程可以叫做“算法化”;第三,根据算法编写计算机程序,使之在计算机上加以实现,建立各种实用的自然语言处理系统,这个过程可以叫做“程序化”;第四,对于所建立的自然语言处理系统进行评测,使之不断地改进质量和原创 2022-03-24 15:48:51 · 1611 阅读 · 0 评论 -
《自然语言处理简明教程》读书笔记:前言
前言自然语言处理(Natural Language Processing,简称NLP),就是以电子计算机为工具,对人类特有的书面形式和口头形式的自然语言的信息进行各种类型处理和加工的技术。这项技术现在已经形成一门专门的边缘性交叉性学科,它涉及语言学、数学和计算机科学,横跨文科、理科和工科三大知识领域。自然语言处理的目的在于建立各种自然语言处理系统,如机器翻译系统、自然语言理解系统、信息自动检索系统、信息自动抽取系统、文本信息挖掘系统、术语数据库系统、计算机辅助教学系统、语音自动识别系统、语音自动合成系统原创 2022-03-23 21:31:21 · 390 阅读 · 0 评论