自然语言处理
文章平均质量分 76
小陈同学-陈百万
这个作者很懒,什么都没留下…
展开
-
自然语言处理(1)-概述
自然语言处理-概述概述概述本系列文章计划总结整理中国科学院大学宗成庆老师《自然语言处理》课程相关知识,参考数目《统计自然语言处理》-第二版,宗成庆。...原创 2019-03-09 22:25:30 · 307 阅读 · 1 评论 -
NLP复习资料(7)-机器翻译、文本分类、情感分析
NLP复习资料-第八章国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。此部分为手稿,高清图下载见链接:原创 2019-09-03 21:21:02 · 972 阅读 · 2 评论 -
NLP复习资料(6)-第十章 语义分析
NLP复习资料-第十章1语义理论简介2格语法4语义网络5词义消歧5语义角色标注6 词向量表示语义分析:P3解释句子或篇章的含义,主要困难(歧义现象,不同人的理解不同,模型方法不成熟)1语义理论简介就是说不同的学者对于词的含义有不同的理解(至少记住两个吧)1.词的指称(词与现实世界事物对应,复杂问题无法定义)2.心理图像(不是所有词义都有清晰的心理图像)3说话者意图(希望听者理解,做出反...原创 2019-09-03 21:04:30 · 1354 阅读 · 0 评论 -
NLP复习资料(4)-第八章 句法分析
NLP复习资料-第八章国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。第八章:语法理论(第三章的后续)1.出发点chomsky的四类文法过于泛化,生成能力太强了,会生成没有语义合理性的句子2.功能合一文法FUG(允许嵌套结构):P9(重要的两个概念)复杂特征集合描述词,句法规则,语义信息,句子功功能结构。合一运算:合并复杂特征集合。掌握P19例1例23.词汇功能语法L...原创 2019-09-03 20:50:40 · 390 阅读 · 0 评论 -
NLP复习资料(3)-六~七章:马尔科夫模型与条件随机场、词法分析与词性标注
NLP复习资料-1.第六章 马尔科夫模型与条件随机场2.第七章 词法分析与词性标注国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。1.第六章 马尔科夫模型与条件随机场1.马尔科夫模型:P6系统每一时刻的状态只与前一个时刻的状态相关,状态转移独立于时间2.隐马尔科夫模型:P13状态与观测的双重随机过程3.HMM的三个问题:(理不理解都行,重要的是后面的应用实例要理解)给定...原创 2019-09-03 17:19:39 · 282 阅读 · 0 评论 -
NLP复习资料(2)-三~五章:形式语言、语料库、语言模型
NLP复习资料-三~五章1.第三章:形式语言2.第四章:语料库第五章:语言模型国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。1.第三章:形式语言1.语言描述的三种途径:穷举法、语法描述(形式语言)、自动机2.形式语言四元组表示,最左推导,最右推导,例3-13.p27. L(G0)>=L(G1)>=L(G2)>=L(G3)4.p30上下文无关文法产生语...原创 2019-09-03 17:10:30 · 495 阅读 · 0 评论 -
NLP复习资料(1)-绪论、数学基础
NLP复习资料-绪论、数学基础1.绪论2.数学基础2.1信息论基础:2.2应用实例:词汇消歧国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。1.绪论1. 语言学、计算语言学、自然语言理解、自然语言处理、中文信息系统这几个概念2. HLT人类语言技术研究内容:机器翻译、信息检索、自动文摘、问答系统、信息过滤 、信息抽取、文档分类、情感分类、文字编辑和自动校对、语言教学、文字识...原创 2019-09-03 16:48:02 · 296 阅读 · 0 评论 -
NLP复习资料(5)-第九章 句法分析
NLP复习资料-第九章1.短语结构分析2.短语结构分析方法的评估指标本系列博文是本人复习国科大宗成庆老师的《自然语言处理》考试时整理的相关资料,个人观点,仅供参考。1.短语结构分析(1)基于CFG规则的分析:没法解决歧义问题。(2)基于PCFG的分析:能够解决歧义问题,但是概率计算条件过于苛刻)(1.1)基于CFG规则的两种方法:线图分析法、CYK方法线图分析法: P20例子掌握了就差...原创 2019-09-03 20:52:14 · 795 阅读 · 0 评论 -
自然语言处理(2)-信息论基础
自然语言处理-数学基础概述1.信息论基础1.1熵1.2 联合熵和条件熵1.3 相对熵和交叉熵1.4 互信息和双字耦合度1.5 噪声信道模型概述本系列文章计划总结整理中国科学院大学宗成庆老师《自然语言处理》课程相关知识,参考数目《统计自然语言处理》-第二版,宗成庆。1.信息论基础1.1熵熵是信息论中的基本概念 ,又称为自信息(self-information)。表示信号源X每发送一个符号(...原创 2019-03-11 21:29:57 · 278 阅读 · 0 评论 -
NLP复习资料(8)-知识图谱、信息抽取
NLP复习资料-第八章第16讲—知识图谱第17讲-信息抽取(知识图谱生命周期中信息获取的关键技术)国科大,宗老师《自然语言处理》课程复习笔记,个人整理,仅供参考。第16讲—知识图谱知识图谱=经典知识表示理论+语义网资源描述框架经典知识表示理论:一阶谓词逻辑,语义网络(有向图描述知识系统),框架(框架名,槽,侧面,和值),脚本(与框架类似,由槽组成,用于描述过程)语义网是一组描述规范:X...原创 2019-09-03 21:26:22 · 981 阅读 · 0 评论