发票抽取问答、海报抽取问答、网页抽取问答、表格抽取问答、试卷抽取问答。
from pprint import pprint
from paddlenlp import Taskflow
import gradio as gr
from paddlenlp import Taskflow
import numpy as np
from PIL import Image
import uuid
docprompt = Taskflow("document_intelligence")
def model_inference(image, prompt):
prompt = prompt.split("?")[:-1]
# TODO:非得要个网络或本地地址,ndarray不行
img = Image.fromarray(np.uint8(image))
filename = "./image/" + str(uuid.uuid4()) + ".png"
img.save(filename)
res = docprompt([{"doc": filename, "prompt": prompt}])
json_out = {"result": res}
return image,json_out
def clear_all():
return None, None, None
with gr.Blocks() as demo:
gr.Markdown("ERNIE-Layout")
with gr.Column(scale=1, min_width=100):
img_in = gr.Image(value="https://bj.bcebos.com/paddlenlp/taskflow/document_intelligence/images/invoice.jpg",
label="Input")
text = gr.Textbox(
value="发票号码是多少?校验码是

该代码示例展示了如何使用ERNIE-Layout模型进行文档理解,包括发票、海报、网页等不同类型的文本和图像信息抽取。用户可以输入问题,模型将从图片中提取相应数据并显示结果。
最低0.47元/天 解锁文章
5832

被折叠的 条评论
为什么被折叠?



