自然语言处理学习笔记(009)

今天上课,发现有几个老师说的概念比较模糊,在这里做下笔记。
1.训练语料和测试语料是什么,它们有什么作用?
2.训练集和发展集,测试集是什么?
3.多级词性标注是什么?
1和2其实我感觉是一个意思。训练集是用来建立模型的,从这些模型中再发现规律。测试集应该就是发展集用来评估模型的预测等能力。
多级词性标注可能就是将某些词性划到第一个等级,某些到第二个。比如:名词和动词是第一级,形容词是第二级。。。

4.词性分析包括:分词,词性标注,命名实体识别。
   句法分析包括:依存关系分析。
   语义分析包括:词义消歧和语义角色标注。


不知道这些观点哪些地方有纰漏,等我实践过再来修正吧。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值