手把手教你使用 Stirling-PDF 搭建自己的 PDF 处理工具

今天,我要教搭建亲自部署一款超级强大的、基于 Web 的开源 PDF 处理工具——Stirling-PDF

file

Stirling-PDF 介绍

Stirling-PDF 是一款功能丰富的 PDF 工具,支持拆分、合并、转换、添加图像、旋转和压缩等操作。它的开发源于对安全灵活 PDF 处理工具的需求,随着时间推移,Stirling-PDF 功能不断增强,用户体验日益提升,已有近 44000 颗星的支持。

该工具的核心理念是提供一个安全、高效的 PDF 处理解决方案,所有操作均在本地完成,不会向外部发送数据。

功能特色

  • 页面操作
    • 查看和编辑 PDF,支持注释、绘图和添加文本。
    • 合并、分割、旋转和移动 PDF 页面。
    • 删除和裁剪页面。
    • 自动分割 PDF 和提取页面。
  • 转换操作
    • 将 PDF 转换为图像,或从图像转换为 PDF。
    • 支持将普通文件、Word、PowerPoint 和 HTML 转换为 PDF。
  • 安全与权限
    • 添加/删除密码,设置权限和水印。
    • 认证/签署 PDF,净化文本。
  • 其他功能
    • 添加签名,检测并删除空白页。
    • 压缩 PDF,提取图像,自动重命名文件。
    • 实现 PDF 的 OCR 功能。

这些功能涵盖了日常工作和专业需求的绝大多数 PDF 处理场景,十分强大!

技术架构

后端技术栈:

  • Spring Boot
  • PDFBox
  • LibreOffice
  • OcrMyPDF

前端技术栈:

  • HTML, CSS, JavaScript
  • PDF.js
  • PDF-LIB.js

使用 docker run 运行 docker 容器

Stirling-PDF 的 docker 镜像可以在 Docker Hub 的 frooodle/s-pdf 或 Github 的 s-pdf 上找到。

请注意,Stirling PDF 针对不同的硬件配置提供了三种不同的版本。

希望在低端硬件上获得最佳性能的用户可以从提供的特定版本中进行选择。

对于喜欢最新功能和更新的用户,建议继续使用latest标签。

版本最新标签
标准版latest
超精简版latest-ultra-lite

运行命令:

docker run -d \
  -p 8080:8080 \
  -v /location/of/trainingData:/usr/share/tessdata \
  -v /location/of/extraConfigs:/configs \
  -v /location/of/logs:/logs \
  -e DOCKER_ENABLE_SECURITY=false \
  -e INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false \
  -e LANGS=en_GB \
  --name stirling-pdf \
  frooodle/s-pdf:latest

也可添加这个内容进行指定路径挂载,但不是必需的

-v /location/of/customFiles:/customFiles \

使用 docker compose 运行 docker 容器

创建并编辑一个 docker-compose.yaml 文件

vim docker-compose.yaml

内容如下:

version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - /location/of/trainingData:/usr/share/tessdata #Required for extra OCR languages
      - /location/of/extraConfigs:/configs
#      - /location/of/customFiles:/customFiles/
#      - /location/of/logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false

运行:

docker compose up -d

在 Windows 中运行

可通过一个可下载的 .exe 文件提供 Windows 兼容性,该文件可从 这里获得,一般下载 Stirling-PDF.exe 即可。这是一个精简版应用程序,提供与 Docker 中的 Stirling-PDF-Ultra-lite 相同的功能,但可执行文件小巧,只有 80MB 大小!

只需下载并启动 .exe 文件,即可访问 Stirling-PDF Web-UI 。需要注意的是,该应用程序需要 JAVA 1721。如果应用程序发现您的系统中未安装此版本的 JAVA,则会提示下载相应版本的链接。

启动后,就可以访问你本地的 8080 端口了 http://127.0.0.1:8080

设置为中文

点击如下图片位置,即可切换为中文

file

接下来就可以使用这个强大的工具啦!!

相关链接

我的博客:https://blog.ivwv.site

### stirling-pdf库或工具在IT项目中的应用 #### 定义与概述 Stirling-PDF通常指的是用于处理PDF文档的一类软件库或工具,在不同的编程环境中有多种实现方式。这类工具允许开发者创建、修改以及操作PDF文件,满足各种业务需求。 #### Python中的stirling-pdf示例 虽然没有名为`stirling-pdf`的具体库,但在Python中存在多个强大的PDF处理库,如PyPDF2和reportlab,这些库能够完成类似的功能[^1]: ```python import PyPDF2 # 打开现有的PDF文件 with open('example.pdf', 'rb') as file: reader = PyPDF2.PdfFileReader(file) page_count = reader.numPages print(f"The document has {page_count} pages.") ``` 上述代码展示了如何利用PyPDF2读取并获取一个PDF文件的页数信息。 对于更复杂的PDF生成任务,则可以考虑使用ReportLab来构建自定义报告: ```python from reportlab.lib.pagesizes import letter from reportlab.pdfgen import canvas def create_pdf(filename): c = canvas.Canvas(filename, pagesize=letter) width, height = letter c.drawString(100, height - 100, "This is a test PDF created using ReportLab.") c.save() create_pdf("test_report.pdf") ``` 这段脚本会生成一个新的PDF文件,并向其中写入一段文字说明。 #### 应用场景 - 自动生成合同、发票等商业文档; - 将其他格式的数据转换成易于打印和存档的PDF版本; - 开发在线服务端口,支持上传图片或其他类型的附件转化为统一标准的电子档案形式保存下来;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

vvw&

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值