一个本地部署的PDF工具箱,功能丰富、操作简单,还支持OCR扫描,Star 25.K+!

在我们日常办公中,经常使用到PDF格式的文件。比如打印投标文件采用PDF格式打印,材料采用PDF格式共享,电子合同采用PDF格式留存。但是因为PDF格式文件不能直接编辑、修改,很多人对PDF的第一印象就是“”麻烦、不好用”!

虽然PDF这么难用,但是为什么还这么多人和企业要求使用呢,主要有以下几个原因:

  • 兼容性好:PDF格式可在几乎所有平台上使用,包括Windows、Mac和Linux等,而且现在不同浏览器都可以直接打开PDF格式文件,无需安装专门的PDF查看软件。

  • 容量体积小:PDF文件通常比其他格式的文档更小,小体积文件更容易共享和下载(比如很多投标系统、带附件管理的平台,都要求上传PDF格式文件)。

  • 安全性高:支持通过加密、签证、水印等操作来保护PDF文档,防止未经授权的用户访问和查看文档内容,同时,PDF格式很难编辑,这有助于原始内容不易被修改。

当然了,市面上也有支持修改PDF格式文件的软件,比如个人电脑安装的:国外的 Adobe Acrobat,国内的福昕PDF等。但是无论是Adobe Acrobat 还是福昕PDF,都需要激活码才能使用编辑等功能。

无需安装的在线PDF编辑也很多,但是很多时候先不说效果怎么样,很多在线编辑都是需要注册才可以使用。更有一些网站“玩套路”,在使用的时候,可以先上传文件,然后进行转换等处理,但是最后你点击下载文件时,才会提醒你需要注册登录,但是这个还不是最“套路的”,最套路的是,好不容易了注册才提示需要充值才能下载转换后的文档。

 

所以,今天给大家介绍一款可以本地部署、开源的,还没有任何广告套路的在线PDF工具箱-Stirling-PDF

01 

— 

 Stirling-PDF 介绍 

一句话介绍Stirling-PDF:一个功能强大的、本地部署的、在线访问的PDF工具箱,企业个人皆可用,提供了一系列丰富的PDF操作功能,通过简单的操作,就可以实现PDF合并、分割P、压缩、格式转换等功能。

🏠  项目信息

#github地址https://github.com/Stirling-Tools/Stirling-PDF#项目地址https://stirlingtools.com/

项目发布几个月的时间,Star 涨到了25K+,可见其受欢迎程度:

🚀功能特性

一页截图都放不下的功能:

02

 Stirling-PDF 安装 

一、Docker安装

Stirling-PDF提供了三种Docker镜像,不同的镜像除了大小不一样外,提供的功能也不一样,可以按照功能需求部署。(本文采用的full版本,最大的镜像)

不同镜像提供的功能列表如下:

功能

Ultra-Lite

Lite

Full

附加密码✔️✔️✔️
加水印✔️✔️✔️
证书签名✔️✔️✔️
更改元数据✔️✔️✔️
更改权限✔️✔️✔️
对比✔️✔️✔️
提取图像✔️✔️✔️
压缩✔️✔️✔️
图片转换PDF✔️✔️✔️
合并PDF✔️✔️✔️
多页布局✔️✔️✔️
PDF转换成图片✔️✔️✔️
删除页面✔️✔️✔️
删除密码✔️✔️✔️
旋转页面✔️✔️✔️
缩放页面✔️✔️✔️
PDF分割✔️✔️✔️
添加图片✔️✔️✔️
文件转换PDF格式✔️✔️
PDF转换HTML✔️✔️
PDF转换TEXT✔️✔️
PDF转换Word✔️✔️
PDF转换XML✔️✔️
PDF转换HTML✔️✔️
PDF修复✔️✔️
xlsx转换PDF✔️✔️
OCR提取✔️
删除空白✔️
#采用 docker run 部署全部功能版本的Stirling-PDFdocker run -d \  -p 8080:8080 \  -v /opt/trainingData:/usr/share/tessdata \  -v /opt/extraConfigs:/configs \  -v /opt/logs:/logs \  -v /opt/customFiles:/customFiles \  -e DOCKER_ENABLE_SECURITY=false \  -e INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false \  -e LANGS=zh_CN \  --name stirling-pdf \  frooodle/s-pdf:latest
#采用 docker compose 部署全部功能版本的Stirling-PDFversion: '3.3'services:  stirling-pdf:    image: frooodle/s-pdf:latest    ports:      - '8080:8080'    volumes:      - /opt/trainingData:/usr/share/tessdata #Required for extra OCR languages      - /opt/extraConfigs:/configs      - /opt/customFiles:/customFiles/      - /opt/logs:/logs/    environment:      - DOCKER_ENABLE_SECURITY=false      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false      - LANGS=zh_CN
docker-compose up -d

安装完成后,访问 http://hostip:8080,默认账号密码[demo/demo]

二、Windows安装

如采用Windows安装,可以直接在github release界面下载EXE文件安装即可,下载链接:https://github.com/Stirling-Tools/Stirling-PDF/releases

03

 Stirling-PDF 使用 

Stirling-PDF 提供的功能很多,本章节只做简单介绍。

  • 第一步,先调整为中文

图片

调整前

调整后

  • PDF转PPT(用的最多的功能)

# 转换后文件大小有点失真,但是微调编辑后即可,比一般工具效果要好(很多工具都是直接截图后转成PPT,无法编辑)

转换过程中,转换后浏览器会自动下载

  • 浏览PDF

  • 单个PDF文件合并、旋转、排序、删除

  • 多个PDF合并

  • PDF添加水印

添加后,浏览器自动下载

添加效果

  • OCR扫描

默认的OCR扫描只支持英文的,需要自行下载中文模型:

# 参考文档地址https://github.com/Stirling-Tools/Stirling-PDF/blob/main/HowToUseOCR.md#

tessdata 项目(https://github.com/tesseract-ocr/tessdata)中下载简体中文语言包:

图片

下载完成后,上传到部署服务 /opt/trainingData(需要参考上文docker部署的映射的目录地址) 目录下:

# 拷贝语言包至ocr目录mv chi_sim.traineddata /opt/trainingData

打开Stirling-PDF ORC 界面,可以看到已经具有中文识别选项:

识别后效果

04

 最后 

本文只是简单介绍了下 stirling-pdf 的使用,stirling-pdf 还具备很多其他的功能,如下图:

如果你已经受够了某些商业在线网站提供的PDF编辑功能,那么不防试试 stirling-pdf ,真的很强大!

<think>嗯,用户想知道怎么用FastGPT实现扫描PDFOCR读取功能。首先,我需要确认FastGPT本身是否支持OCR功能。根据之前的了解,FastGPT主要是基于语言模型的,可能不直接处理图像或扫描件。所以可能需要结合其他工具或者API来实现OCR的部分。 接下来,用户的问题涉及到扫描PDF,这类文件通常是图片形式的,里面的文字不能直接复制,必须通过OCR技术识别。常见的OCR服务包括Google Cloud Vision、AWS Textract、Tesseract等。可能需要先提取PDF中的图片,然后用OCR识别,再把结果传给FastGPT处理。 然后,步骤应该是分阶段的。首先处理PDF,提取图片,然后进行OCR识别,接着整合到FastGPT中。可能需要用Python库比如PyMuPDFpdf2image来提取图片。OCR部分可以用Tesseract,或者调用API。然后,将识别后的文本输入到FastGPT中进行后续处理。 用户可能需要具体的代码示例,比如如何用PyMuPDF提取图片,用Tesseract识别,然后调用FastGPT的API。同时,还要考虑错误处理,比如图片质量不高导致识别错误的情况,或者PDF中有多页需要批量处理。 另外,还要注意FastGPT的配置,比如如何将OCR后的文本作为输入,可能需要调整prompt或者参数来优化结果。可能还需要处理大文件的情况,比如分页处理或者异步处理。 还有,用户可能关心成本和性能,比如使用云服务API的费用,或者本地部署Tesseract的资源消耗。需要给出不同方案的优缺点,让用户根据实际情况选择。 最后,生成相关问题的时候,要考虑用户可能接下来会问如何提升OCR准确率,或者如何处理多语言PDF,以及如何整合到现有系统中等问题。确保覆盖这些潜在的问题,帮助用户全面了解解决方案。</think>### 如何通过 FastGPT 实现扫描PDFOCR 读取功能? #### 技术实现步骤 1. **PDF 图片提取** - 使用工具如 `PyMuPDF` 或 `pdf2image` 将扫描PDF 转换为图像序列 - 示例代码: ```python from pdf2image import convert_from_path def pdf_to_images(pdf_path): return convert_from_path(pdf_path, dpi=300) ``` 2. **OCR 文字识别** - 调用 OCR 引擎识别图像中的文字,推荐方案: - 本地部署:`Tesseract OCR` + `pytesseract` 库 - 云服务:Google Vision API 或 Azure Computer Vision - Tesseract 示例: ```python import pytesseract from PIL import Image def ocr_core(image): return pytesseract.image_to_string(image, lang='chi_sim+eng') ``` 3. **FastGPT 集成** - 将 OCR 结果作为输入传递给 FastGPT - 通过 API 调用实现结构化处理: ```python def process_with_fastgpt(text): response = requests.post( FASTGPT_API_ENDPOINT, json={"input": text, "config": {"temperature": 0.7}} ) return response.json()["output"] ``` #### 关键优化点 - 图像预处理:使用 `OpenCV` 进行降噪、锐化、对比度调整(提升 OCR 准确率 20-40%)[^2] - 多线程处理:对 PDF 多页内容实施并行处理 - 结果校验:添加正则表达式验证关键字段(如日期、金额等格式) #### 部署架构 ``` [扫描PDF] → [图片提取模块] → [OCR引擎] → [文本清洗] → [FastGPT处理] → [结构化输出] ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值