NLP
文章平均质量分 83
tsingxia
这个作者很懒,什么都没留下…
展开
-
深度学习环境配置及github上的模型复现
这是我用到的一个github模型LayoutlMv: 将表单进行结构化处理的预训练模型。利用ocr提取表单中图片信息,transformer对文字和表格信息进行统一处理模型连接:https://github.com/microsoft/unilm/blob/master/layoutlmft/README.md我是按照模型提示的步骤进行操作,到pip install -r requirements.txt出现了问题。原因是我们有配深度学习的环境。接下来是正确的步骤Step1:配C++的环境- 下原创 2022-04-13 16:27:05 · 3785 阅读 · 1 评论 -
富文本文档处理layoutMv
文档智能是一种旨在针对富文本文档进行理解并抽取其中非结构化信息的技术。LayoutLM的成功证明了针对文本和布局进行预训练的有效性。在此基础上,我们提出了多模态预训练模型LayoutLMv2及其多语言扩展LayoutXLM,通过对文本、布局和图像进行联合预训练,进一步提高了模型的性能,在多项任务中取得了新的突破。PPT链接:aka.ms/AAdcz3u富文本文档receiptscanned formdigital-born invoice富文本文档的理解-表单理解传统处理方法:文本进行OCR原创 2022-04-10 22:40:18 · 619 阅读 · 0 评论 -
TextRank文本摘要算法
摘要提取:对文本进行降维处理原创 2022-04-07 18:59:02 · 1847 阅读 · 0 评论 -
摘要提取模型--实验一
抽取式文本摘要提取模型的函数结构,算法结构,bug解决,应用思考原创 2022-04-04 12:06:20 · 1177 阅读 · 0 评论