哈尔滨工业大学本部2022秋自然语言处理课程期末考试
相关博客
(116条消息) 哈工大自然语言处理_哈工大自然语言处理期末考试_kekoxl的博客-CSDN博客
(116条消息) 哈工大19年自然语言处理_叫我池池的博客-CSDN博客
题型
- 选择题
- 填空题
- 判断题
- 简答题
- 计算题
送分题(bushi)
PS:4.5学分和5学分是同一张考卷,但是有两道题不一样;
考试内容参考
- 客观题多涉及基本概念,包括语言学基本概念、机器学习基础知识、深度学习基础知识等。比如:
语言和言语是一般和个别关系?
篇章是否是语义的最大分析单位?
语言的基本关系(组合关系和聚合关系)
文字可以是任意符号?
生物是动物的__?(词之间的义位关系)
RNN相比CNN优点是可以更好地支持并行计算?
一个词的词向量维度定义为100,请问取三个词的卷积核大小为?
IBM算法相比传统机器翻译方法最大的贡献是提出了噪声信道模型?
机器学习把自然语言问题视作排序问题?
序列标注是生成模型还是判别模型?
以下哪一种机器学习方法不适用于自然语言问题?
Glove词向量相比word2vec向量更好地利用了共现概率?
词向量训练的常见特征类型
- 主观题(注意排序不分先后)
1.HMM算法计算概率,按过程写出维特比向量(三个词的简单模型)
2.基于字符串匹配的分词方法
(1)给出句子,利用FMM和BMM给出分词结果
(2)分词歧义的类型
3.实体评价&最大熵
(1)最大熵的特征区间为前一个词、当前词和后一个词,写出最大熵的特征向量(参考实验二的特征向量)
(2)特征区间为前一个词的实体特征,给出基于最大熵的实体提取训练方案与测试方案
(3)(4.5学分)给出基于RNN的实体提取过程(图文结合)
(3)(5学分)好像是基于Transformer和什么来着...(记不太清了)
4.实体链接实现的一般步骤(信息抽取part2)
5.句法分析
(1)给出形如(S (NP 我) (VP (P 是) (NP 傻逼)))的句子,给出语法分析树(原题最右边的括号有五个,挺复杂的);
(2)给出文法规则(注意终结符的规则...)
(3)PCFG与CFG的区别(我觉得可能要答上它的三个性质)
6.评价标准
我们这次考的是词向量的评价标准:斯皮尔曼等级相关系数和类比推理
7.自然语言和语料库
(1)基于给出的材料得到自然语言在计算层面的性质/特点(送分题,ymy老师担心送不到分,甚至亲自来提醒。不过属鼠还是写偏了...)
(2)根据材料,写出基于语料库研究自然语言的不足
8.机器学习基础知识
(4.5学分)什么时候要采取k折交叉验证法?
(5学分)好像是BERT来着...
备注:
1.主观题应该是相对完整的,还可以参考其他同学的博客对比;
2.此次考试没有考察伪代码,但ymy老师说下一次考试可以考虑添加。
复习建议
- scj老师部分ppt多为英文且包含大量图片,建议对于不懂的模型都上网查一下(特别是神经网络部分)
- CL1-CL2、CLx1-CLx2设计的语言学知识和评价方法也会进行考察,复习时不要遗漏