框架下cookie的使用_NLP(三)使用tensorflow搭建序列标注任务框架（下）-CSDN博客

本文链接：https://blog.csdn.net/weixin_39855634/article/details/111693332

代码：

lylylylylyly/modelforCWSgithub.com

评测准备：我这里采用了很受欢迎的评测工具：conlleval.pl。可以直接得到accuracy，precision，recall以及F1值。可以在这里下载conlleval+perl环境+conlleval使用说明。也可以到我的网盘上下载：链接：https://pan.baidu.com/s/1jNy9ruAGJYkoaButnfstBg 提取码：ftj2 。

首先，安装perl，然后在命令窗口使用：perl conlleval.pl < label_and_predict.txt > result.txt。result.txt保存的就是测试信息，可以查看。但需要注意的是，可能这个工具开始是用作测试命名实体识别任务，如果是分词，需要把结果严格按照要求的样子修改，不然会出现precisions, recall, f1都为0的情况。我是在每个label后面统一加了'-mm'。即类似: '0-mm', '1-mm', '2-mm', '3-mm'。

更新于2020/03/05----这里加一个conlleval.pl的坑。使用的是BIO标注法，而不是BIOES标注法。如果你模型的输出是BIOES标注的，需要把E(end)转化为I，S(single)转化为B。最坑的一点，是需要把所有的O标注都转化为0，然后才能写到文件里。要严格按照这种形式，得到的结果才是对的。

这一部分主要介绍测试部分，之前通过训练已经生成了训练模型。测试部分的结构为，按顺序从上往下一个个调用：

def test(self, test_data):
       ... ...
def dev_one_epoch(self, sess, dev):
       ... ...
def predict_one_batch(self, sess, seqs):
       ... ...
def evaluate(self, label_list, seq_len_list, data, epoch=None):
       ... ...

数据处理和训练时一样，使用saver.restore(sess, model_path)加载模型参数。mark：model_path这里有一个坑。windows系统上路径形式一定要是“./mode_path/mode_name”的形式。不然会报错找不到模型。也可以直接用函数tf.train.latest_checkpoint()获得最新的模型路径。然后，还是按照批数据进行预测，一直到整个数据都预测完成，就是一个epoch结束。评估时，要先生成一个label.txt。每一行是[token, label, predict]。然后，直接调用conlleval.pl就可以了。