山东大学计算机学院2022-2023第二学期自然语言处理期末考试回忆版

aqqqaqqqq

于 2023-06-21 15:55:34 发布

阅读量1.5k

点赞数 10

文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aqqqaqqq7/article/details/131329374

版权

（20分）1、（1）什么是n-gram？

（2）“I am in Shandong University” 写出1-gram、2-gram、3-gram

（3）给了四个语句，计算（2）中的2-gram概率。

（20分）2、（1）写出常见的中文分词方法。

（2）写出HMM算法的组成部分并解释，说明HMM能够同时实现分词和词性标注的原理。

（20分）3、（1）画出统计机器翻译图示，通过概率公式说明翻译过程。

（2）画出神经机器翻译模型，并解释翻译过程。

（15分）4、（1）写出一个离散化的缺点。

（2）画出CBOW和skip-gram的网络结构，解释原理。

（15分）5、（1）给出三个mask的例子，说明预训练模型能够从中学到什么（示例是mask了her，说明它学到了指代关系）。

（2）举出Encoder、Decoder、Encoder-Decoder三个结构的代表模型，并结合例子说明原理。

（10分）6、你对大模型的感受，和大模型的发展与应用前景。

关注

10
点赞
踩
20

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。