哈工大2022年秋自然语言处理期末考试

哈尔滨工业大学本部2022秋自然语言处理课程期末考试

相关博客

(116条消息) 哈工大自然语言处理_哈工大自然语言处理期末考试_kekoxl的博客-CSDN博客

(116条消息) 哈工大19年自然语言处理_叫我池池的博客-CSDN博客

题型
  • 选择题
  • 填空题
  • 判断题
  • 简答题
  • 计算题
  • 送分题(bushi)

PS:4.5学分和5学分是同一张考卷,但是有两道题不一样;

考试内容参考
  • 客观题多涉及基本概念,包括语言学基本概念、机器学习基础知识、深度学习基础知识等。比如:
语言和言语是一般和个别关系?
篇章是否是语义的最大分析单位?
语言的基本关系(组合关系和聚合关系)
文字可以是任意符号?
生物是动物的__?(词之间的义位关系)
RNN相比CNN优点是可以更好地支持并行计算?
一个词的词向量维度定义为100,请问取三个词的卷积核大小为?
IBM算法相比传统机器翻译方法最大的贡献是提出了噪声信道模型?
机器学习把自然语言问题视作排序问题?
序列标注是生成模型还是判别模型?
以下哪一种机器学习方法不适用于自然语言问题?
Glove词向量相比word2vec向量更好地利用了共现概率?
词向量训练的常见特征类型
  • 主观题(注意排序不分先后)
1.HMM算法计算概率,按过程写出维特比向量(三个词的简单模型)
2.基于字符串匹配的分词方法
(1)给出句子,利用FMM和BMM给出分词结果
(2)分词歧义的类型
3.实体评价&最大熵
(1)最大熵的特征区间为前一个词、当前词和后一个词,写出最大熵的特征向量(参考实验二的特征向量)
(2)特征区间为前一个词的实体特征,给出基于最大熵的实体提取训练方案与测试方案
(3)(4.5学分)给出基于RNN的实体提取过程(图文结合)
(3)(5学分)好像是基于Transformer和什么来着...(记不太清了)
4.实体链接实现的一般步骤(信息抽取part2)
5.句法分析
(1)给出形如(S (NP 我) (VP (P 是) (NP 傻逼)))的句子,给出语法分析树(原题最右边的括号有五个,挺复杂的);
(2)给出文法规则(注意终结符的规则...)
(3)PCFG与CFG的区别(我觉得可能要答上它的三个性质)
6.评价标准
我们这次考的是词向量的评价标准:斯皮尔曼等级相关系数和类比推理
7.自然语言和语料库
(1)基于给出的材料得到自然语言在计算层面的性质/特点(送分题,ymy老师担心送不到分,甚至亲自来提醒。不过属鼠还是写偏了...)
(2)根据材料,写出基于语料库研究自然语言的不足
8.机器学习基础知识
(4.5学分)什么时候要采取k折交叉验证法?
(5学分)好像是BERT来着...

备注:

1.主观题应该是相对完整的,还可以参考其他同学的博客对比;

2.此次考试没有考察伪代码,但ymy老师说下一次考试可以考虑添加。

复习建议
  • scj老师部分ppt多为英文且包含大量图片,建议对于不懂的模型都上网查一下(特别是神经网络部分)
  • CL1-CL2、CLx1-CLx2设计的语言学知识和评价方法也会进行考察,复习时不要遗漏
  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值