//个人学习笔记,如有错误,请指正
词性标注是自然语言处理中比较基础的部分
词性标注采用监督学习
和词性相关的几种因素
形态学
句法
语义
几种算法:
正则表达式标注器
基于(人为设定的)规则,比如ing结尾,标记为动词
查询标注器
类似unigram
N-gram标注器
unigram:每个单词最可能的词性
bigram:在已知前一个单词的词性的前提下,单词最可能的词性
trigram:在已知前两个单词的词性前提下,单词最可能的词性
//个人学习笔记,如有错误,请指正
词性标注是自然语言处理中比较基础的部分
词性标注采用监督学习
和词性相关的几种因素
形态学
句法
语义
几种算法:
正则表达式标注器
基于(人为设定的)规则,比如ing结尾,标记为动词
查询标注器
类似unigram
N-gram标注器
unigram:每个单词最可能的词性
bigram:在已知前一个单词的词性的前提下,单词最可能的词性
trigram:在已知前两个单词的词性前提下,单词最可能的词性