Paddlex部署安装
- Docker安装PaddlePaddle,注意版本和cuda版本要求,有一个需要注意的点,paddle相关组件开发都基于PaddlePaddle,python版本支持到3.10。
- 安装PaddleX, 验证文档信息抽取能力。注意cuda仅支持两个版本,这里用的是12.3版本的。
- 下载官方代码;
- 验证测试是否成功;
git clone https://github.com/PaddlePaddle/PaddleX.git
cd PaddleX
pip install -e .
paddlex --install PaddleClas # 例如PaddleOCR
PaddleOCR
PaddleDetection
PaddleClas
# 验证表格检测
paddlex --pipeline table_recognition --input /home/data/PaddleX/test_image/test1.jpg --device gpu:0
验证文档信息抽取能力
from paddlex import create_pipeline
try:
# 创建管道
pipeline = create_pipeline(
pipeline="PP-ChatOCRv3-doc",
llm_name="ernie-3.5",
llm_params={"api_type": "qianfan", "ak": "", "sk": ""} # 请填入您的ak与sk
# llm_params={"api_type": "aistudio", "access_token": ""} # 请填入您的access_token,否则无法调用大模型
)
# 本地图片路径
image_path = '/home/data/PaddleX/paddlex/test1.jpg'
# 执行视觉预测
visual_result, visual_info = pipeline.visual_predict(image_path)
# 保存视觉预测结果
for res in visual_result:
res.save_to_img("./output")
res.save_to_html('./output')
res.save_to_xlsx('./output')
# 构建向量
vector = pipeline.build_vector(visual_info=visual_info)
# 执行聊天
chat_result = pipeline.chat(
key_list=["项目"],
visual_info=visual_info,
vector=vector,
)
# 打印聊天结果
chat_result.print()
except Exception as e:
print("An error occurred:", str(e))
本文参考了PaddleX官网,感谢!