超棒的基于AI的PDF文档翻译工具

PDFMathTranslate 是一款强大的 PDF 文档翻译工具,专门用于翻译包含复杂公式、图表、目录和注释等内容的科学论文。此工具能有效地保留原始文档的排版布局,不牺牲文本的清晰度或者结构,同时支持多国语言。您可根据需要选择多种知名翻译服务,包括 Google、DeepL、Ollama(OpenAI 的前身)等,确保翻译质量和准确性。

在线演示

免费服务 (https://pdf2zh.com/) ,转换比较慢,还是建议自己搭建服务器或者运行python脚本。

安装

https://github.com/Byaidu/PDFMathTranslate/

方法一、命令行工具

  1. 确保安装了版本大于 3.8 且小于 3.12 的 Python

  2. 安装此程序:

    pip install pdf2zh
    
  3. 执行翻译,生成文件位于 当前工作目录

    pdf2zh document.pdf
    

方法二、便携式安装

无需预先安装 Python 环境

下载 setup.bat 并双击运行

方法三、图形交互界面

  1. 确保安装了版本大于 3.8 且小于 3.12 的 Python

  2. 安装此程序:

    pip install pdf2zh
    
  3. 开始在浏览器中使用:

    pdf2zh -i
    
  4. 如果您的浏览器没有自动启动并跳转,请用浏览器打开:

    http://localhost:7860/
    

方法四、容器化部署

  1. 拉取 Docker 镜像并运行:

    docker pull byaidu/pdf2zh
    docker run -d -p 7860:7860 byaidu/pdf2zh
    
  2. 通过浏览器打开:

    http://localhost:7860/
    

可以使用Google免费接口

在这里插入图片描述

也可以采用硅基流动的API

注册地址https://cloud.siliconflow.cn/i/DosittDz

在这里插入图片描述

看看效果,这是用硅基流动中的Qwen/Qwen2.5-7B-Instruct 免费的大模型翻译出来的

在这里插入图片描述

### 在 Docker 容器中安装 `pdf2zh` 工具 为了在 Docker 容器中成功安装并配置 PDF 处理工具 `pdf2zh`,需遵循一系列特定的操作流程来确保环境设置正确无误。以下是详细的指南: #### 创建自定义 Dockerfile 来集成 `pdf2zh` 通过编写定制化的 Dockerfile 文件可以实现对基础镜像的扩展,在其中加入必要的依赖项以及目标应用程序——即 `pdf2zh`。 ```dockerfile FROM ubuntu:latest # 更新包列表并安装基本软件包 RUN apt-get update && \ apt-get install -y software-properties-common python3-pip poppler-utils wget git # 设置工作目录 WORKDIR /app # 下载并安装 pdf2zh 及其依赖 RUN pip3 install --upgrade pip && \ pip3 install pdfminer.six chardet requests beautifulsoup4 lxml pdf2image pypdf2 zhconv # 添加启动脚本 (假设有一个简单的 shell 脚本来运行 pdf2zh) COPY entrypoint.sh /entrypoint.sh RUN chmod +x /entrypoint.sh ENTRYPOINT ["/entrypoint.sh"] ``` 此段代码展示了如何基于 Ubuntu 构建一个新的 Docker 镜像,并在其内部安装了一系列 Python 库以便支持 `pdf2zh` 的功能[^1]。 #### 修改容器编码格式以适应中文字符显示 为了避免可能出现的中文乱码现象,建议调整容器内的区域设定为适合处理汉字的语言环境变量。这可以通过向 `docker run` 命令添加额外参数 `-e LANG=zh_CN.UTF-8` 实现,从而指定默认使用的语言和地区信息[^3]。 #### 使用 Docker Compose 简化多服务管理 如果计划长期维护该应用或与其他微服务协同运作,则推荐采用 Docker Compose 方案简化复杂场景下的编排任务。下面是一个示例 YAML 文件片段,它描述了如何利用 Compose 文件构建包含 `pdf2zh` 功能的服务实例: ```yaml version: '3' services: pdf2zh-service: build: . environment: - LANG=zh_CN.UTF-8 volumes: - ./data:/app/data ports: - "5000:5000" ``` 上述配置不仅指定了要从当前路径下读取 Dockerfile 并构建新映像的方式,还设置了共享卷用于持久存储数据文件夹 `/app/data` ,并通过端口转发使得外部能够访问到由 `pdf2zh` 提供的服务接口。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值