考试一共考了7道题
1.写一个判断是gbk,unicode,big5的设计思路和算法,要求是不能利用各个内码的特殊分布(我认为是老师给的PPT后面三个中的随便一个)
2.最大分词匹配的设计思想和算法,以及对正向和逆向分词结果的举例。
3.给出两种和n-gram有关的平滑方式的设计思想和公式(PPT上都有)
4.这个我记得模糊了,我记忆中是给出词性标注和名实体识别中隐马尔科夫的状态和观察体,举例即可。
5.是隐马尔科夫和vitebe算法结合中这两个变量的意义和计算公式,看老师PPT背下就可以了,就图中那两。
6.考的是chart中基本策略和规则调用策略,问的我记得是让你解释一下和作用。题目具体内容我记不清了。
7.朴素贝叶斯消歧的原理和算法(这个我没在PPT上看到,可能是我看的不仔细)