分享和整理一些在学习NLP技术时碰到的术语
1. OOV(Out Of Vocabulary)
在自然语言处理或者文本处理的时候,通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的(如WordNet语料库),或者是自己定义的,或者是从当前数据集提取的。
假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是未登录词(Out Of Vocabulary),简称OOV。
2.
不定期更新。。。
分享和整理一些在学习NLP技术时碰到的术语
在自然语言处理或者文本处理的时候,通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的(如WordNet语料库),或者是自己定义的,或者是从当前数据集提取的。
假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是未登录词(Out Of Vocabulary),简称OOV。
不定期更新。。。