说明:
GLUE (General Language Understanding Evaluation) 数据集:为了能够标准化的和综合性的评估NLU(自然语言理解)算法和模型而构造出来的一套包含数据集,在线评估平台的工具。
其中包含了九个数据集,其中MRPC(Microsoft Research Paraphrase Corpus)是微软的语料库,收录了3600对句子并标注每对句子是否在语义上等价。
参考:https://www.jianshu.com/p/3d0bb34c488a
环境:
- 硬件:gtx1060 6g 6代i7 12g
- 系统:win10
- python:3.6.7
- tensorflow:1.11 (官网requirements.txt有写)
下载:
- 官方网址:https://github.com/google-research/bert
- GLUE(MRPC):https://gist.github.com/W4ngatang/60c2bdb54d156a41194446737ce03e2e
- 首先当然是在官网clone