译自Matthew的《A Good Part-of-Speech Tagger in about 200 Lines of Python》,本文用最精简的代码演示了如何写一个基于感知机的高性能词性标注器。以下是正文:自然语言处理的最新技术大部分都停留在学术界,但学术界往往非常谨慎、不愿意把话说满以免作茧自缚。但太谦虚也没有意义,本文就展示了如何写一个高性能的词性标注器。现在有成千上万种所谓的“最好的词性标注技术”,但它们都没有卵用,你用Averaged Perceptron就行了。(译注:术语Average...
继续阅读:码农场 » 200行Python代码实现感知机词性标注器
原文链接:http://www.hankcs.com/nlp/averaged-perceptron-tagger.html