标题前期知识准备
学习目标
知识树
研究背景
不同类型标签对应一个id,例如"IO"列一共有3x1+1=4种id(3代表实体类型,PER,DATE,LOC,1代表一个I,+1代表O)
论文泛读
CRF通俗易懂的理解 https://zhuanlan.zhihu.com/p/44042528
将特征放到预测处而不是输入层可能会有更好的表现
算法讲解
马尔可夫模型,通过以前的数据预测未来情况,例如通过前一天的天气状况预测明天。隐马尔可夫模型是通过隐藏状态预测未来数据,例如可以通过可观测的雪糕销量预测隐含的天气状况
i对应q,o对应v
LSTM-CRF-BiLSTM-CRF模型结构
word embedding 是分布式假设,可以把字词表示的很好,语义相近的词距离认为相近。
使用CRF层规范BILSTM