Pytorch 给出的命名体识别(NER)的小例子,简洁清晰,深入原理及实现细节,比较适合想深入学习又没有好的入门途径的同学。不过他过于简洁,一些理论背景没有介绍,对于咱们这些,在门口晃悠的渣渣掌握起来还是有点儿费劲。
所以,本文打算总结自己的学习过程,从原理到代码,走一遍这个小例子,算是摸着石头入门吧~
outline:
- 这个模型的用途
- 模型的结构
- 几个关键代码的原理
1、模型用途
输入是一句话,或者更严谨一点说是一个多个词(单词)组成的自然序列,然后这个模型其中的实体(比如人名,地名,组织机构名等)识别出来。
比如输入:我爱北京
模型给出标记:O O B-LOC I-LOC
我 | O | 其他 |
爱 | O | 其他 |
北 | B |