第一步 下载所需
下载bert源码和模型
首先我们下载bert的源码和官方的模型,去官网 :
https://github.com/google-research/bert
下载官网源码:
下载官方模型:
好好找一下,往下翻翻,肯定有下面这样一个位置。
下载GLUE数据集
要运行bert的模型,需要用到指定的GLUE数据集,数据集下载地址:
https://gluebenchmark.com/tasks
GLUE是一个统称,里面有很多个独立的数据集,例如如果只使用MRPC进行测试,那可以只下载MRPC数据集,如果出现无法下载的情况,可以使用我下载好的:
链接:https://pan.baidu.com/s/1rhy138f0wPNgTZwjO0CV4g
提取码:dkf6
第二步 运行环境配置
经过上面的步骤,你已经得到了bert运行的所有数据,现在只需要配置你本地的环境。
创建虚拟环境
这里使用conda创建一个新的虚拟环境:
conda create -n bert python=3.7
bert的运行需要tensorflow的支持,要在该环境中安装一下tensorflow,需要注意的是,一定要安装下面指定版本,不然后面运行会报错。
conda activate bert // 进入刚创建的虚拟环境
conda install tensorflow==1.14 // 安装tensorflow 1.14 版本
创建工程
使用pycharm创建一个用于运行测试的新的工程项目。
然后把bert源码,glue数据集,官网模型都放到该项目中,看我的目录结构:
如果你是自己下载的glue数据集,可能和我的目录结构有一点点不一样,请忽略多余的文件即可。
还有主要的一点,就是把该工程的python环境注意配置好,配置成刚才新创