![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
LayoutLM
文章平均质量分 83
littletomatodonkey
work and life balance
展开
-
多模态文档理解:基础概念-数据-模型
文档理解最近在看layoutlm相关的内容,之前没有接触过,顺便把遇到的一些新概念总结一下。任务DocVQA基于文档的视觉问答,给一张文档图像以及提问,给出答案。以下面的图片为例,通过给出问题邮政编码是多少?,期望能够得到80202的回答,通过给出问题印章显示什么日期,期望得到1970年9月23日的回答。参考文献:https://arxiv.org/abs/2007.00398数据集训练pretrain所需的数据集下游任务数据集FUNSD数据集用于文档空间布局分析以及表单理解的数据集原创 2021-08-20 18:26:45 · 2000 阅读 · 0 评论 -
LayoutLM源码踩坑记录
LayoutLM源码踩坑记录前言:最近在看VQA相关内容,正好发现了LayoutLM这个repo,有开源代码,有pretrained model,就想着白嫖一波LayoutLM repo地址:https://github.com/microsoft/unilm/tree/master/layoutlm环境准备安装lfs(下载大文件)ubuntu下面,可以按照下面的方法安装lfscurl -s https://packagecloud.io/install/repositories/gith原创 2021-07-04 17:39:07 · 2496 阅读 · 7 评论