Bert源码（一）

最新推荐文章于 2024-05-29 16:20:17 发布

Young_Foo_

最新推荐文章于 2024-05-29 16:20:17 发布

阅读量866

点赞数

分类专栏：深度学习文章标签：自然语言处理深度学习 tensorflow

本文链接：https://blog.csdn.net/weixin_43609605/article/details/103709880

版权

Bert源码（一）run_classifier.py

run_classifier.py是Bert模型在句子分类、句子对推理等任务上微调的脚本，所以想要把bert用于下游的部分任务，这个文件的代码必须要完全弄懂。

开始部分通过tf.flags.FLAGS来设置参数，分为必选参数和可选参数。

必选参数

可选参数

init_checkpoint 保存的bert预训练模型
do_lower_case 是否将输入文本转为小写，如果是uncased bert模型就设置为true，否则设置为false，默认为true
max_seq_length 经过WordPiece切词后的最长输入长度，序列过长将被切割，序列过短将被填充。最大长度不能超过bert预训练模型中的max_position_embeddings
do_train 是否在train上训练
do_eval 是否在dev上测试
do_predict 是否在test上进行预测结果
train_batch_size
eval_batch_size
predict_batch_size
learning_rate
num_train_epochs 默认为3
warmup_proportion 默认为0.1
save_checkpoints_steps 默认1000步保存一次模型
iterations_per_loop
use_tpu
tpu_name
tpu_zone
gcp_project
master
num_tpu_cores

InputExample类充当的是数据样例结构体，里面包含四个成员变量

PaddingInputExample类里面啥也没有，算是一个空的InputExample

InputFeatures类是将InputExample实例向量化后的结果，里面有五个成员变量

关注