《论文阅读》Bidirectional LSTM-CRF Models for Sequence Tagging
在序列标注问题上,该论文所对比的模型LSTMCRFBiLSTMBiLSTM-CRF句子转化为词向量序列(词向量序列可以随机初始化或使用已经训练好的词向量),在模型训练时还可以继续训练。要回答这个问题,首先要明白什么是泛化能力。泛化能力是指机器学习算法对新鲜样本的适应能力,简而言之是在原有的数据集上添加新的数据集,通过训练输出一个合理的结果。学习的目的是,该能力称为泛化能力。在NER任务中,表示,在前向传播过程中,两者计算结果比较相近,同时被识别为命名实体的概率很高。由于网络参数过多,训练数据少,或者训练次数
复制链接