今天上课,发现有几个老师说的概念比较模糊,在这里做下笔记。
1.训练语料和测试语料是什么,它们有什么作用?
2.训练集和发展集,测试集是什么?
3.多级词性标注是什么?
1和2其实我感觉是一个意思。训练集是用来建立模型的,从这些模型中再发现规律。测试集应该就是发展集用来评估模型的预测等能力。
多级词性标注可能就是将某些词性划到第一个等级,某些到第二个。比如:名词和动词是第一级,形容词是第二级。。。
4.词性分析包括:分词,词性标注,命名实体识别。
句法分析包括:依存关系分析。
语义分析包括:词义消歧和语义角色标注。
不知道这些观点哪些地方有纰漏,等我实践过再来修正吧。
1.训练语料和测试语料是什么,它们有什么作用?
2.训练集和发展集,测试集是什么?
3.多级词性标注是什么?
1和2其实我感觉是一个意思。训练集是用来建立模型的,从这些模型中再发现规律。测试集应该就是发展集用来评估模型的预测等能力。
多级词性标注可能就是将某些词性划到第一个等级,某些到第二个。比如:名词和动词是第一级,形容词是第二级。。。
4.词性分析包括:分词,词性标注,命名实体识别。
句法分析包括:依存关系分析。
语义分析包括:词义消歧和语义角色标注。
不知道这些观点哪些地方有纰漏,等我实践过再来修正吧。