unilm layoutlmv3 训练代码调试 SER 推理可视化

blackswanjj

已于 2022-08-24 08:51:10 修改

阅读量2.3k

点赞数 5

文章标签：深度学习 nlp 自然语言处理

于 2022-08-20 10:10:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gjj19901005/article/details/126378516

版权

前言

因为是先调的paddleocr里ppstructure/vqa 部分的layoutxlm，由于paddleocr 还没有支持layoutlmv3，但是v3 相对来说把 visual_backbone 部分的cnn 换成transformer 速度快很多，所以尝试了unilm 的v3版本。

一、训练

1. dataload 部分修改

因为是从paddleocr vqa 转过去的，训练数据和训练的label_list 已经有了，这里修改了部分数据读取代码xfund.py，读已有的paddle格式的训练数据。

2. 训练部分修改存储best model

根据自己的类别，修改config中的参数，和num_classes

增加以下训练参数，可以在训练过程中保存best_model和last_model

--save_steps 100

--evaluation_strategy steps

--eval_steps 100

--metric_for_best_model eval_f1

--save_strategy steps

--load_best_model_at_end True

--save_total_limit 2

二、推理

推理部分不好改的地方是用的huggingface的transformer库，输入的组织和输出的可视化。输入的组织和可视化参考paddleOCR vqa中的infer_ser，这里只写了注意不同的地方。

1. transformer 库加载模型和tokenizer，传入模型路径文件夹。

2. infer 函数参考paddleOCR vqa中的infer_ser，送入模型的时候，略有不同。

3. preprocess 和postprocess 修改如下

preprocess 中tokenizer 换成 transformer 里的调用形式

后面input_ids position_ids segment_ids 按照xfund.py 和DataCollatorForKeyValueExtraction的处理方式处理，与paddle 的最大区别是有cls和sep token，还有这里生成position_ids和segment_ids的方式。

postprocess 里注意token序列的index 从1-510

最后可视化参考paddleocr 里的draw_ser_results

关注

5
点赞
踩
11

收藏

觉得还不错? 一键收藏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

blackswanjj CSDN认证博客专家 CSDN认证企业博客

码龄15年

4: 原创

83万+: 周排名

18万+: 总排名

3815: 访问

: 等级

65: 积分

12: 粉丝

13: 获赞

16: 评论

15: 收藏

私信

关注

热门文章

最新评论

unilm layoutlmv2/layoutxlm RE 模型转 onnx
blackswanjj: 可以拆开两个模型导出，前面的backbone和后面的redecoder，是redecoder里有一个batchsize的for循环静态导出的时候就是固定的，buildrelation可以在外面做掉不在模型forward里做
unilm layoutlmv2/layoutxlm RE 模型转 onnx
DYF-AI: 貌似是计算rel_classifier时只能一个batch一个batch地输入
unilm layoutlmv2/layoutxlm RE 模型转 onnx
DYF-AI: 这种情况是否需要拆开两个模型导出？
unilm layoutlmv2/layoutxlm RE 模型转 onnx
DYF-AI: 模型代码中有个for循环,还是说这个for循环是指build_relation时的for循环？麻烦指教一下哈，感谢
unilm layoutlmv2/layoutxlm RE 模型转 onnx
DYF-AI: 因为模型代码中有个for循环,这里是指你重写bilinear 前向代码有for循环吗？是这个原因导致batchsize只能为1吗？

最新文章

目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。